Preprocesamiento y calidad de datos

En los últimos años, se ha producido un inmenso crecimiento de los datos, lo que ha dado lugar al Big Data. Esto requiere una gran infraestructura informática con capacidades de procesamiento de alto rendimiento. Conseguir que los grandes datos estén listos para el análisis y la extracción de conocimiento es una tarea difícil y requiere que los datos sean pre-procesados para mejorar la calidad de los datos brutos. La representación y la calidad de los datos es una de las facetas más importantes en el proceso de la ciencia de datos.

El pre-procesamiento de datos es una práctica preliminar en la ciencia de datos en la que los datos brutos se transforman en un formato adecuado para el análisis y los algoritmos de modelización. Mejora la calidad de los datos limpiando, normalizando, transformando, reduciendo y extrayendo características relevantes de los datos brutos. El pre-procesamiento de datos mejora significativamente el rendimiento de los algoritmos de aprendizaje automático, lo que a su vez se traduce en una extracción precisa del modelo. Descubrir el conocimiento a partir de datos ruidosos, irrelevantes y redundantes es una tarea difícil, por lo que identificar con precisión los valores atípicos, suplir los valores perdidos y reducir el volumen de datos útiles plantea problemas desafiantes en la ciencia de datos.

Los retos en el pre-procesamiento de datos se centran en la automatización y la toma de decisiones precisas en su uso encadenado; el ajuste para abordar la estructura compleja de los datos y la adaptación de las técnicas para aumentar la fiabilidad, la equidad y la transparencia de los modelos obtenidos posteriormente por los algoritmos de la ciencia de datos y el pre-procesamiento de datos para las canalizaciones de datos biomédicos de múltiples fuentes y los métodos de obtención de imágenes.

Contacto: Salvador García López

Investigadores relacionados:

Letra:

  Nombre Email Área Cat.
Benítez Sánchez, José Manuel J.M.Benitez@decsai.ugrdMOfUIvs.es Ciencia de Datos y Big Data DaSCI, Inteligencia Computacional DaSCI Doctor
Cano de Amo, José Ramón jrcano@ujaennzN37ld.es Ciencia de Datos y Big Data DaSCI Doctor
natalia-diaz
Díaz Rodríguez, Natalia ndiaz@decsai.uA1GrKywjgr.es Inteligencia Computacional DaSCI, Ciencia de Datos y Big Data DaSCI Doctor
García Gil, Diego Jesús djgarcia@decsai.wRM4HYugr.es Ciencia de Datos y Big Data DaSCI, Inteligencia Computacional DaSCI Doctor
García López, Salvador salvagl@decsai.ugr.zsMxIgZes Ciencia de Datos y Big Data DaSCI Doctor
Górriz Sáez, Juan Manuel gorriz@5hRefd91hugr.es Aplicaciones Tecnológicas DaSCI Doctor
Herrera Triguero, Francisco herrera@decsai.wTqzv3NF.ugr.es Aplicaciones Tecnológicas DaSCI, Ciencia de Datos y Big Data DaSCI, Inteligencia Computacional DaSCI Doctor
Lucena Sánchez, Estrella estrellalucena@ugSRkvEFyQJ0TXr.es Ciencia de Datos y Big Data DaSCI Doctor - Otros
Luengo Martín, Julián julianlm@decsai.i2vChmugr.es Ciencia de Datos y Big Data DaSCI Doctor
Ortíz García, Andrés aortiz@irDQe4hQ5c.uma.es Aplicaciones Tecnológicas DaSCI Doctor
Romero Zaliz, Rocío rocio@uLxVwNGZ_COIgr.es Aplicaciones Tecnológicas DaSCI Doctor
Triguero Velázquez, Isaac triguero@decrtNTAwUsai.ugr.es Ciencia de Datos y Big Data DaSCI
Val Muñoz, Coral del delval@decsaixDpiVro9uT1.ugr.es Aplicaciones Tecnológicas DaSCI Doctor