El INCLIVA y la inteligencia artificial para luchar contra el COVID-19

El Instituto de Investigación Sanitaria INCLIVA, del Hospital Clínico de Valencia, y el Instituto de Investigación del Hospital Universitario 12 de Octubre de Madrid i+12 de Madrid participan en el desarrollo de un nuevo sistema de Inteligencia Artificial (IA) y aprendizaje automático liderado por la Universitat Politècnica de Valencia (UPV), que facilitará el pronóstico y la estimación de la evolución de pacientes con COVID-19, en el momento del ingreso hospitalario y resulta especialmente útil ante rebrotes del virus. El Sistema de Ayuda a la Decisión Clínica permitirá –mediante la combinación de síntomas, comorbilidades y pruebas de laboratorio- conocer el posible nivel de gravedad e intervenir anticipadamente ante la previsión, por ejemplo, de una insuficiencia respiratoria aguda.

Dr. Rafael Badenes

El Dr. Rafael Badenes, del Grupo de Investigación en Anestesia de INCLIVA, Jefe de la Sección de Anestesia del Hospital Clínico de Valencia y profesor de la UV, asegura que, “desde un punto de vista clínico, el contar con herramientas de Inteligencia Artificial que sean capaces de predecir, en fases tempranas de la enfermedad, cuál va a ser el devenir de la misma, constituye un elemento crucial en la lucha contra la enfermedad”. En este sentido, explica que “en aquellos casos en los que se prevé mayor gravedad, se podrían instaurar tratamientos de manera más precoz, con el objetivo final de reducir los ingresos en UCI y la mortalidad».

La complejidad del COVID hace imprescindible el uso de técnica avanzadas

“La heterogeneidad y complejidad de la COVID19 hace imprescindible el uso de técnicas muy avanzadas y sofisticadas de análisis, para poder identificar los patrones clínicos y epidemiológicos todavía muy desconocidos en esta enfermedad. Creemos que este proyecto puede contribuir a lograr este objetivo”, añade el Dr. Agustín Gómez de la Cámara, jefe de la Unidad de Investigación y Soporte Científico del Hospital 12 de Octubre.

Es importante destacar el carácter multidisciplinar e innovador del estudio en el que han participado profesionales muy diversos, como ingenieros, médicos especialistas en medicina preventiva, en anestesiología y reanimación,  biólogos y bioestadísticos.

El desarrollo de esta herramienta se enmarca en el Proyecto SUBCOVERWD-19, que ha sido uno de los seleccionados en la convocatoria del Fondo Supera COVID-19, impulsada por Crue Universidades Españolas, Banco Santander, a través de Santander Universidades, y el Consejo Superior de Investigaciones Científicas (CSIC).

Calidad de los datos

Uno de los principales desafíos para el aprendizaje automático en el COVID-19 es la calidad de los datos, reto al que esta herramienta del Biomedical Data ScienceLab-ITACA de la UPV, ayudará a responder. Según explica Juan Miguel García-Gómez, coordinador del BDSLab-ITACA de la UPV, el aprendizaje automático tiene el potencial de ayudar en esta tarea mediante la aplicación de técnicas de aprendizaje no supervisado y supervisado a los Registros de Salud Electrónicos (EHR) de los hospitales. Estas técnicas permiten extraer los patrones más significativos del historial de comorbilidad del paciente, los síntomas y las pruebas de laboratorio en el momento del ingreso, hasta sus últimos datos de la Unidad de Cuidados Intensivos (UCI), que pueden conducir a una estratificación temprana del paciente y a la predicción de su gravedad.

Sin embargo, hay fuertes evidencias de que los datos reales (real world data, RWD) contenidos en los Registros de Salud Electrónicos de los hospitales están lejos de ser perfectos, lo que limita su extracción de conocimiento tanto por los profesionales médicos como por las máquinas que pueden ayudar al diagnóstico del paciente. Además, la variabilidad inherente a la práctica clínica y la codificación de datos entre los hospitales, o incluso entre sus poblaciones destinatarias, puede sesgar cualquier resultado extraído de los datos.

“Por lo tanto, los métodos de aprendizaje automático y de IA requieren una evaluación y explicación de la Calidad de los Datos (DQ) asociada tanto al aprendizaje como a las nuevas predicciones para garantizar soluciones correctas y pragmáticas y esto es a lo que contribuye la metodología que hemos ideado, que será empleada, por primera vez, en esta herramienta”, apunta Carlos Sáez, investigador postdoctoral del BDSLab-ITACA de la UPV y coordinador del proyecto.

 Estudio previo

La falta de datos representativos de COVID-19 es una de las razones por las que se ha desaconsejado el uso clínico de modelos predictivos recientemente desarrollados para COVID-19, según un estudio publicado recientemente en el British Medical Journal.

“La calidad de los datos es crítica. Especialmente en los entornos de compartición de datos en múltiples sitios, la variabilidad entre las fuentes de datos es una posible fuente de sesgos inesperados en el aprendizaje de modelos y su posterior utilización”, apunta Carlos Sáez.

Este trabajo y sus resultados se han recogido en la nueva herramienta COVID-19 Subgroup Discovery and ExplorationTool http://covid19sdetool.upv.es/