Data Science para el estudio de la enfermedad de Alzheimer: patrones ocultos en la conectividad estructural
Autores:
Ernesto Estrada
Institute of Applied Mathematics (IUMA), Universidad de Zaragoza and ARAID Foundation, Government of Aragon
Eufemia Lella
Innovation Lab Exprivia and Istituto Nazionale di Fisica Nucleare, sezione di Bari
l mayor reto de la investigación en Neurociencia es arrojar luz sobre los mecanismos de neurodegeneración que originan las enfermedades cerebrales. La ciencia de los datos proporciona una herramienta esencial para extraer información aparentemente oculta de datos clínicos, genéticos y de imágenes. En particular, la resonancia magnética ponderada por difusión proporciona información sobre las características de la conexión estructural entre las regiones del cerebro y, por lo tanto, permite estudiar cómo cambia esto en presencia de la enfermedad. La identificación de patrones estructurales conduce al descubrimiento de biomarcadores cuantitativos, preparando el camino para el uso de la Inteligencia Artificial para el diagnóstico, tan pronto como sea posible, de enfermedades neurodegenerativas.
La neurociencia, equipada con las herramientas de la ciencia de los datos y la IA, desempeña hoy en día un papel fundamental, en particular en la investigación de la enfermedad de Alzheimer, la enfermedad neurodegenerativa más extendida y discapacitante para la que, hasta la fecha, no hay cura. Un gran desafío es el del diagnóstico temprano, que representa una meta importante en la perspectiva de probar nuevos medicamentos.
Metodologías de Data Science en Neurociencia: el cerebro como una red compleja
Los datos de partida, proporcionados por los exámenes de resonancia magnética, son imágenes tridimensionales del cerebro y el nivel de gris de cada vóxel tiene un significado y un contenido de información relacionados con el tipo específico de examen realizado. Estas imágenes constituyen datos "en bruto" y, por lo tanto, para interpretar y extraer conocimientos de ellas, es crucial el uso de metodologías para modelar y filtrar la información. La ciencia de los datos, con técnicas estadísticas y de aprendizaje automático, proporciona las herramientas y metodologías para extraer información de grandes cantidades de datos, partiendo de su formato "en bruto". Particularmente en la Neurociencia, en los datos de imágenes del cerebro, las metodologías de ingeniería de características a menudo utilizan la extracción de la conectividad para extrapolar eficazmente la información relacionada con la conectividad entre las regiones del cerebro, gracias a la Teoría de Redes Complejas.
El cerebro es el más complejo de los sistemas complejos, compuesto por diferentes partes que en su interacción producen comportamientos que no surgirían considerando las partes individuales individualmente. Al reconstruir, mediante los llamados algoritmos de "tractografía", los rasgos fibrosos que conectan sus regiones anatómicas, el cerebro puede ser modelado como una red compleja representada por un gráfico cuyos nodos son las regiones anatómicas y cuyos enlaces se pesan según el número de rasgos fibrosos que los conectan. Las características topológicas y de conectividad del gráfico se estudian con la Teoría de Redes Complejas que permite describir cuantitativamente la conectividad del cerebro y destacar sus alteraciones en presencia de enfermedades. Por ejemplo, con la Teoría de Redes Complejas es posible determinar los nodos con más conexiones en la red, los llamados "hubs", o los nodos y conexiones más importantes desde el punto de vista del tráfico de información en la red, o la tendencia de los nodos a formar clusters o la tendencia de la red a formar módulos. Estas configuraciones en la red cerebral pueden variar en presencia de la enfermedad.
La distancia de comunicación destaca los mecanismos de alteración de la conectividad en la enfermedad de Alzheimer
El concepto clásico de distancia entre dos nodos de una red está asociado a la longitud del camino, es decir, al número de enlaces que conforman el camino entre dos nodos. La idea más común en el campo de la Teoría de Redes Complejas es que la comunicación entre dos nodos de una red se produce a través del camino de mínima longitud entre ellos. Pero en muchas redes del mundo real, la información también puede fluir por caminos que no son mínimos, piense por ejemplo en la propagación de los chismes en las redes sociales, donde la información puede fluir de ida y vuelta varias veces antes de llegar a su destino final. En estos casos, el camino de longitud mínima no es suficiente para describir plenamente la comunicabilidad dentro de la red.
En 2008 Ernesto Estrada y Naomichi Hatano propusieron una nueva métrica de las redes complejas, la comunicabilidad, introduciendo un nuevo concepto de comunicación dentro de la red. La comunicabilidad tiene en cuenta no sólo el camino de longitud mínima entre dos nodos, sino todos los caminos posibles entre ellos, dando mayor peso a los de menor longitud. Partiendo del concepto de comunicabilidad Ernesto Estrada ha introducido un nuevo concepto de distancia en las redes complejas, la distancia de comunicabilidad entre dos nodos, asociada a la diferencia entre la cantidad de información que partiendo de un nodo retorna a sí misma y la cantidad de información que partiendo de un nodo llega al otro nodo. Estos nuevos conceptos de comunicación y distancia en redes son especialmente adecuados para estudiar aquellas redes en las que la información fluye a través de un proceso de difusión, como sucede en el conectivoma cerebral extraído de las imágenes de resonancia magnética ponderadas en difusión. Además, este nuevo concepto de distancia es muy adecuado para caracterizar las alteraciones de conectividad en una enfermedad cerebral como la enfermedad de Alzheimer, que algunos investigadores plantean como hipótesis un "síndrome de desconexión" y una enfermedad relacionada con la pérdida de integridad de las fibras de materia blanca que representan las vías de comunicación entre las regiones del cerebro.
La distancia de comunicabilidad se ha utilizado para poner de relieve las alteraciones de la conectividad entre las regiones del cerebro en los pacientes de Alzheimer. A partir del modelo epidemiológico matemático de la propagación del factor de enfermedad (DF), se demostró que la distancia de comunicabilidad representa la diferencia entre la circulabilidad del DF en torno a dos regiones y su transmisibilidad de una región a otra. A partir de la distancia de comunicabilidad, se calculó la trayectoria de longitud mínima en términos de comunicabilidad entre pares de regiones cerebrales y se descubrió que esta medida es mucho más significativa, en comparación con la trayectoria de longitud mínima clásica, para detectar las diferencias de conectividad entre el grupo sano y el enfermo. Utilizando metodologías de selección de características en la ciencia de los datos, como las pruebas de permutación estadística, se encontraron 399 pares de regiones con diferencias estadísticamente significativas en la trayectoria de longitud mínima en términos de comunicabilidad, la mayoría de las cuales implican regiones pertenecientes a dos hemisferios diferentes o ambas regiones del hemisferio izquierdo o conexiones del Vermis, encontrando resultados acordes con la hipótesis de que la enfermedad de Alzheimer es un síndrome de desconexión. Además, se comprobó que las conexiones que tienen en promedio una mayor diferencia de distancia de caminata de longitud mínima en cuanto a la comunicabilidad, entre el grupo de los sanos y el grupo de los pacientes, se refieren a grupos de regiones que incluyen diferentes zonas del cerebelo, el Vermis y la Amígdala. Un resultado muy interesante, que surgió gracias al uso de técnicas estadísticas de la Ciencia de los Datos, y que representa un patrón de conectividad del cerebro de los pacientes de Alzheimer, es que en el 76,9% de las regiones cerebrales dañadas la longitud mínima del trayecto en términos de comunicabilidad disminuye en los pacientes en comparación con los sanos. Este resultado contrario a la intuición indica cómo la enfermedad de Alzheimer transforma la red cerebral en un sistema más eficiente en la transmisión de la enfermedad, porque disminuye la circulabilidad del DF alrededor de las regiones del cerebro en comparación con su transmisibilidad a otras regiones.
Nuevas perspectivas para la IA/IV en el diagnóstico de la enfermedad de Alzheimer
El descubrimiento de nuevos biomarcadores de enfermedades neurodegenerativas y patrones relacionados con los mecanismos de alteración del funcionamiento del cerebro, siempre abren nuevas e intrigantes perspectivas para el uso de la IA en el diagnóstico automático lo antes posible. En particular, estos resultados científicos recientes sugieren la eficacia del uso de una nueva métrica de distancia para describir el flujo de información entre las regiones del cerebro, abriendo el camino a nuevos análisis sobre la topología y la organización de la red cerebral y, por consiguiente, a la extracción de nuevas características de información que se darán como entrada a los algoritmos de IA para formular modelos de predicción y aplicar nuevas herramientas para el diagnóstico automático.
Complete el formulario e ingrese sus datos.