Analítica de datos en tiempo real

El proceso de obtención de modelos a partir de datos, ya sea para predicción o supervisión, es a menudo difícil o imposible de realizar con las técnicas tradicionales debido a que la cantidad de datos a analizar es demasiado grande como para ser almacenados antes de su procesamiento. Además, cada vez es más frecuente la exigencia de explicar lo que está pasando en el momento en el que está pasando, esto es, se precisa de un aprendizaje incremental que mantenga los modelos actualizados y listos para su uso en todo momento. La existencia de fuentes de datos que, de forma continua, generan información ordenada cronológicamente y que superan las capacidades de almacenamiento y procesamiento habituales, es ya una realidad en muchas aplicaciones que crecen cada día, como en telecomunicaciones, tráfico de vehículos, consumo energético, comercio, finanzas, medicina, fisiología, deportes, robótica o redes sociales, entre otras. Este aspecto conecta, además, con el IoT (internet de las cosas) y la Edge Computing (computación periférica), donde cada vez más se necesitan técnicas de análisis de datos en tiempo real altamente eficientes para su implementación directa en los dispositivos sensoriales.

Para abordar este problema, se manejan flujos de datos (en inglés, data streams), que son secuencias infinitas de registros estructurados. La característica clave de estos sistemas es que los datos producidos no se almacenan de forma permanente sino que se procesan “al vuelo”, esto es, cada dato es analizado, procesado y finalmente olvidado, pudiendo así abordar ingentes cantidades de datos en tiempo real incluso con reducidas capacidades de almacenamiento y cálculo. Los flujos de datos plantean nuevos desafíos para el aprendizaje automático y la analítica de datos, como el uso de recursos computacionales limitados, necesitad de respuesta rápida, adaptación a cambios en la distribución de datos, o la escasez de etiquetado de datos debido a la llegada tan rápida.

En DaSCI investigamos en el diseño de técnicas de aprendizaje automático capaces de construir modelos en tiempo real en función de los datos que se van recibiendo y lo hemos aplicado con éxito a problemas como el análisis de electroencefalograma, medicina de cuidados críticos, actividad en Twitter, monitorización de uso del móvil o consumo energético.

Contacto: Jorge Casillas Barranquero

Investigadores relacionados:

Letra:

  Nombre Email Área Cat.
Carmona del Jesus, Cristóbal J. ccarmona@ujaenW61V7xYEVw.es Ciencia de Datos y Big Data DaSCI Doctor
Casillas Barranquero, Jorge casillas@deE199P5X5csai.ugr.es Ciencia de Datos y Big Data DaSCI Doctor
García Gil, Diego Jesús djgarciaf.bwRbyvI6H1@decsai.ugr.es Ciencia de Datos y Big Data DaSCI, Inteligencia Computacional DaSCI Doctor
Herrera Triguero, Francisco herrera@kkyw0@decsai.ugr.es Aplicaciones Tecnológicas DaSCI, Ciencia de Datos y Big Data DaSCI, Inteligencia Computacional DaSCI Doctor
Zwir, Igor igorzwirQ5H9aY3@ugr.es Ciencia de Datos y Big Data DaSCI Doctor
Scroll Up