Multilabel Classification. Problem Analysis, Metrics and Techniques

18 febrero, 2020

Francisco Herrera, Francisco Charte, Antonio J. Rivera, Maria J. del Jesús

La clasificación de patrones de datos en distintas categorías no excluyentes entre sí, a través de un modelo generado habitualmente mediante técnicas de aprendizaje supervisado, es un problema que en la última década ha generado un gran volumen de publicaciones.

Publica: Springer

2016

ISBN: 978-3-319-41111-8
Páginas: 194

El presente libro comienza ofreciendo en su tres primeros capítulos una introducción amplia al problema de clasificación multi-etiqueta y las técnicas más habituales para abordar esta tarea, así como una detallada descripción de las métricas que se emplean tanto para caracterizar este tipo de conjuntos de datos como para evaluar los resultados producidos por los clasificadores. Además se facilita una lista de los conjuntos de datos multi-etiqueta usados con mayor frecuencia en estudios científicos.

Tras los primeros capítulos, de nivel introductorio al problema en el que se centra este título, se lleva a cabo una exhaustiva revisión de los métodos publicados en la literatura. Agrupándolos en tres capítulos según el enfoque con que afrontan la tarea, se describen algoritmos basados en técnicas de transformación de los datos, en la adaptación de métodos clásicos y también basados en ensembles.

En un tercer bloque se encuentran capítulos monográficos que tratan aspectos específicos tales como el aprovechamiento de la correlación entre etiquetas, la alta dimensionalidad, que en los datos multi-etiqueta afecta no solo a las variables de entrada sino también a las de salida, o el obstáculo que representa el desbalanceo entre las etiquetas asignadas a las muestras de datos. Cada uno de estos temas se analiza y va acompañado de una o varias soluciones diseñadas por los autores, incluyendo algoritmos publicados en revistas de primer nivel.

La parte final del libro describe un software para el conocido entorno R, desarrollado por los autores, diseñado para facilitar el trabajo con conjuntos de datos multi-etiqueta. La funcionalidad del paquete, accesible en su mayor parte tanto desde la línea de comandos como desde una interfaz gráfica, facilita la exploración de este tipo de conjuntos de datos, así como la aplicación de transformaciones básicas.

El libro, cuya tabla de contenidos se facilita a continuación, tiene asociado un sitio web (https://github.com/fcharte/SM-MLC) en el que se ofrecen distintos recursos: enlaces a repositorios de datos, herramientas software, implementación de algoritmos, etc.

  • Introduction
  • Multilabel Classification
  • Case Studies and Metrics
  • Transformation-Based Classifiers
  • Adaptation-Based Classifiers
  • Ensemble-Based Classifiers
  • Dimensionality Reduction
  • Imbalance in Multilabel Datasets
  • Multilabel Software