COVIDGR

COVIDGR es un conjunto de imágenes de rayos X para asistir en el diagnóstico de la enfermedad COVID-19, construido con la estrecha colaboración de expertos radiólogos en España.

Gracias a esta colaboración con el equipo de expertos radiólogos, ha sido posible construir esta base de datos. La base de datos está compuesta de radiografías anonimizadas de pacientes de distintos hospitales, siguiendo un protocolo estricto de etiquetado. Esto permite la construcción de modelos de diagnóstico de la COVID-19, previamente obstaculizada por la falta de bases de datos públicas que hubieran sido verificadas por expertos. Las radiografías son más rápidas de realizar y están más extendidas que otras pruebas como los TAC o los test RT-PCR. De esta forma, las radiografías pueden facilitar la diagnosis de la COVID-19 a mucha gente en un corto periodo de tiempo. 

Imágenes

Todas las imágenes han sido obtenidas considerando sólo la vista PA (posteroanterior, donde los rayos viajan desde la espalda hacia delante). Después, todas las imágenes han sido recortadas usando una segmentación de los pulmones con el modelo U-Net. Una vez hecha la segmentación, se obtiene el cuadrado más pequeño que la contiene y se añade un 2.5% de margen a dicho cuadrado, evitando perder parte de los pulmones, y se recorta. Esto minimiza el potencial ruido que introducen las anotaciones en las radiografías, así como la inclusión de otras partes del cuerpo.

Etiquetado

Las imágenes positivas (COVID-19) corresponden a pacientes que han dado positivo en una prueba RT-PCR que se ha hecho con menos de 24 de diferencia que la radiografía. Además, todas las imágenes positivas han sido anotadas usando el índice RALE para denotar su severidad. Aquellas imágenes que no presentan síntomas pero que son positivas de acuerdo al test RT-PCR se denotan como severidad Normal-PCR+. El resto de severidades son Mild (Leve), Moderate (Moderado) y Severe (Grave).

COVIDGR-1.0
La primera versión del dataset COVIDGR contiene 426 radiografías positivas y 426 radiografías negativas (852 en total), realizadas en hospitales de Granada (España). Los casos positivos cubren todas las severidades RALE: hay 76 imágenes de severidad Normal-PCR+, 100 mild (leves), 171 moderate (moderadas) y 79 severe (graves). Las distintas versiones de COVIDGR están disponibles en un repositorio de GitHub.

Referencia al artículo:

S. Tabik, A. Gómez-Ríos, J. L. Martín-Rodríguez, I. Sevillano-García, M. Rey-Arena, D. Charte, E. Guirado, J. L. Suárez, J. Luengo, M. A. Valero-González, P. García-Villanova, E. Olmedo-Sánchez and F. Herrera, “COVIDGR Dataset and COVID-SDNet Methodology for Predicting COVID-19 Based on Chest X-Ray Images,” in IEEE Journal of Biomedical and Health Informatics, vol. 24, no. 12, pp. 3595-3605, Dec. 2020, doi: 10.1109/JBHI.2020.3037127.

Fecha de publicación:

Junio de 2020

Contacto:

Siham Tabik

Scroll Up