Preprocesamiento de datos

En los últimos años se ha observado un inmenso crecimiento de los datos, dando lugar al Big Data. Éste exige una gran infraestructura computacional con capacidades de procesamiento de alto rendimiento. La preparación de grandes datos para el análisis y extracción de conocimiento es una tarea difícil y requiere que los datos sean preprocesados para mejorar la calidad de los datos en bruto. La representación y la calidad de los datos es una de las facetas más importantes en el proceso de ciencia de datos. El preprocesamiento de datos es una práctica preliminar en ciencia de datos en la que los datos en bruto se transforman en un formato adecuado para los algoritmos de análisis y modelado. Éste mejora la calidad de los mismos al limpiar, normalizar, transformar, reducir y extraer las características pertinentes de los datos brutos. El preprocesamiento de datos mejora considerablemente el rendimiento de los algoritmos de aprendizaje automático, lo que a su vez da lugar a una extracción de modelos precisa. El descubrimiento de conocimientos a partir de datos ruidosos, irrelevantes y redundantes es una tarea difícil, por lo que la identificación precisa de los valores extremos y atípicos, la suplantación de los valores perdidos y la reducción del volumen de datos útiles plantea problemas desafiantes en ciencia de datos. Los retos en preprocesamiento de datos están enfocados hacia la automatización y la toma de decisiones precisa y eficiente en su uso concatenado; el ajuste para abordar datos de estructura compleja y la adaptación de técnicas para aumentar la confiabilidad, imparcialidad y transparencia de los modelos obtenidos posteriormente por algoritmos de ciencia de datos.

Contacto: Salvador García López

Investigadores relacionados:

Letra:

  Nombre Email Área Cat.
Benítez Sánchez, José Manuel J.M.Benitez@decsE2iCfdgCSN8Jai.ugr.es Ciencia de Datos y Big Data DaSCI, Inteligencia Computacional DaSCI Doctor
Cano de Amo, José Ramón jrcano@uja.Vbho9en.es Ciencia de Datos y Big Data DaSCI Doctor
Charte Ojeda, Francisco fcharte@ujSefNU2Haen.es Ciencia de Datos y Big Data DaSCI Doctor
García Gil, Diego Jesús djgarcia@decsai.uCdTiYjgt2gr.es Ciencia de Datos y Big Data DaSCI, Inteligencia Computacional DaSCI Doctor
García López, Salvador salvagl@decsai.ugRIr53Fllqhr.es Ciencia de Datos y Big Data DaSCI Doctor
Górriz Sáez, Juan Manuel gorriz@ugA1OHoXU20r.es Aplicaciones Tecnológicas DaSCI Doctor
Herrera Triguero, Francisco herrera@deJIOnIHCp@hccsai.ugr.es Aplicaciones Tecnológicas DaSCI, Ciencia de Datos y Big Data DaSCI, Inteligencia Computacional DaSCI Doctor
Luengo Martín, Julián julianlm@dec5@6c3oD4aeLsai.ugr.es Ciencia de Datos y Big Data DaSCI Doctor
Martínez del Río, Francisco fmartin@ujaLVXNnkNjgHXlen.es Ciencia de Datos y Big Data DaSCI Doctor
Ortíz García, Andrés aortiz@ic.uma.s@Afg2q6po1es Aplicaciones Tecnológicas DaSCI Doctor
Romero Zaliz, Rocío rocio@ugVWDwSvhr.es Aplicaciones Tecnológicas DaSCI Doctor
Val Muñoz, Coral del delval@decsai.nTB8hOqdg1GBugr.es Aplicaciones Tecnológicas DaSCI Doctor
Scroll Up