Aprovechar el potencial de los datos médicos de pacientes de COVID para luchar contra la pandemia: el proyecto unCoVer

Una red de 29 instituciones de 18 países trabaja con datos sanitarios de pacientes de COVID para extraer patrones epidemiológicos, analizar la eficacia de los tratamientos y trazar estrategias contra la presente y futuras pandemias. Los grupos MIDAS y GBT pertenecientes al CTB de la Universidad Politécnica de Madrid lideran el diseño e implementación de la arquitectura de análisis de datos.

El proyecto “Unravelling Data for Rapid Evidence-Based Response to COVID-19”, financiado por el programa marco europeo de investigación H2020 y coordinado por el Prins Leopold Instituut Voor Tropische Geneeskun de Amberes, reúne registros sanitarios electrónicos de más de 22.000 pacientes hospitalizados por COVID y datos de vigilancia y cribado de más de 1.900.000 casos positivos, con actualizaciones continuas.

Esos datos provienen principalmente de hospitales de primera línea, pero también de agencias sanitarias nacionales y estudios de observación dirigidos por investigadores. Se trata de una información heterogénea, ya que a esta diversa procedencia de los datos se añade la variedad de factores que constan en los registros de los pacientes, dado el abanico de posibles reacciones individuales al virus. Como resultado, se ha acumulado una gran cantidad de datos cuyo análisis podría desvelar interesantes patrones para luchar contra la COVID-19.

Se trata de información valiosa y disponible pero infrautilizada, debido principalmente a dos barreras; por un lado, la dificultad técnica para trabajar de forma sincronizada con datos no harmonizados provenientes de distintos países y, por otro lado, manejar información sensible y sujeta a directrices éticas y de protección de datos internacionales como son los datos médicos.

La red unCoVer propone una solución a ambos problemas a través de la construcción de una infraestructura de datos federada que facilita su interoperabilidad en un entorno seguro, cumpliendo al mismo tiempo con las directrices éticas y de protección de datos. Dicha propuesta se desarrolla principalmente en el paquete de trabajo que lideran los grupos MIDAS (Minería de Datos y Simulación) y GBT (Grupo de Bioingeniería y  Telemedicina) de la Universidad Politécnica de Madrid, bajo la dirección de la Prof. Ernestina Menasalvas y el Prof. Enrique J. Gómez Aguilera.

La solución propuesta se basa en el análisis de datos federado, un paradigma de aprendizaje automático que pretende abordar el problema de la gobernanza y la privacidad de los datos mediante el entrenamiento de algoritmos en colaboración sin intercambiar los datos en sí. Se ha desarrollado como una alternativa para la colaboración interinstitucional y propone que el proceso viaje a los datos y no los datos al proceso, intercambiando estadísticas agregadas en lugar de datos a nivel de paciente.

El primer paso es armonizar datos heterogéneos procedentes de 23 instituciones, incluyendo hospitales, centros de investigación, organizaciones sin ánimo de lucro y autoridades sanitarias locales, entre otros. A su vez es necesario usar una infraestructura que permita la federación de datos, para lo que se ha usado OPAL.  Una vez que los datos están disponibles y armonizados, a estos se accede mediante DataSHIELD que permite realizar los análisis de manera local y posteriormente integra los resultados, nunca los datos. Los datos permanecen seguros y bajo el completo control de sus custodios.

La infraestructura que se ha generado es la que se muestra en la figura:

Además, la UPM ha desarrollado un dashboard que permite acceder a los análisis. Esta aplicación permite, entre otras opciones, mostrar: Datos Generales, Análisis de Calidad General, Análisis de Población y Análisis de Supervivencia. Se trata de una “caja de herramientas” para trabajar con datos en tiempo real que ayuda a descubrir certezas de la enfermedad en las que apoyar estrategias sanitarias contra el virus. (Tanto esta como el resto de las herramientas empleadas en la arquitectura propuesta se basan en tecnologías de código abierto disponibles gratuitamente en línea).

Las tareas técnicas desarrolladas por el equipo de UPM en unCover se complementan con otras que buscan sacar el máximo provecho de los datos, reuniendo la experiencia clínica y de análisis estadístico para identificar aquellas cuestiones de interés para responder al COVID-19. Además, se trabaja para garantizar la colaboración con la comunidad científica y la sociedad en general mediante actividades de formación y difusión.

Este proyecto, que finaliza en noviembre de 2022, supone una valiosa aportación metodológica en el uso de datos médicos contra la actual y futuras pandemias.

 

Más información en la web del proyecto: https://uncover-eu.net/

Share:

Other news