¿Por qué dos personas con la misma enfermedad genética pueden empezar a desarrollar síntomas con décadas de diferencia? Esta es una de las grandes preguntas en torno a la enfermedad de Huntington, un trastorno neurodegenerativo hereditario que afecta al movimiento, la memoria y la salud mental. Ahora, un equipo de la Universitat de Barcelona ha dado un paso importante para responderla utilizando herramientas avanzadas de inteligencia artificial.
Investigadores de la Facultad de Medicina y Ciencias de la Salud y del Instituto de Neurociencias de la UB han aplicado técnicas de aprendizaje automático para identificar los factores genéticos que influyen en la edad de aparición de la enfermedad. El estudio, publicado en el prestigioso foro internacional Machine Learning in Computational Biology, analiza por qué algunos pacientes desarrollan síntomas en la juventud, mientras que otros no los manifiestan hasta edades avanzadas.
Más allá del gen responsable
“El número de repeticiones de secuencias genéticas es importante, pero no lo es todo”, explican los investigadores
La enfermedad de Huntington está causada por una mutación en el gen HTT, que provoca la repetición excesiva de una secuencia genética llamada CAG. En general, cuanto mayor es el número de repeticiones, antes aparecen los síntomas. Sin embargo, este factor no explica por completo la gran variabilidad entre pacientes.
“El número de repeticiones es importante, pero no lo es todo”, explican los investigadores. El nuevo trabajo demuestra que existen otros genes que pueden acelerar o retrasar el inicio de la enfermedad y que interactúan entre sí de forma compleja.
Para identificarlos, el equipo ha utilizado modelos de inteligencia artificial capaces de analizar miles de variables genéticas al mismo tiempo y detectar patrones invisibles para los métodos estadísticos tradicionales.
El análisis de más de 9.000 pacientes
Para llevar a cabo el estudio, los investigadores analizaron datos genéticos de más de 9.000 personas con Huntington. Gracias a este amplio conjunto de información, lograron identificar tanto genes ya conocidos —especialmente relacionados con la reparación del ADN— como nuevos candidatos implicados en procesos celulares clave. Uno de los hallazgos más relevantes es que los mecanismos biológicos que influyen en la enfermedad no son iguales para todos los pacientes. En función de si las repeticiones CAG son más cortas o más largas, entran en juego factores genéticos distintos. Demostrando que el impacto de los genes depende del contexto individual de cada persona, lo que refuerza la necesidad de enfoques personalizados.
El estudio, liderado por el investigador Jordi Abante, con Caterina Fuses como primera autora, supone una aplicación pionera de modelos de lenguaje de inteligencia artificial al análisis del genoma humano.
De izquierda a derecha, Caterina Fustes, Jordi Abante y Berta Ros, de la Facultad de Medicina y Ciencias de la Salud y el Instituto de Neurociencias de la Universidad de Barcelona
Unos sistemas que funcionan como una especie de traductor entre la información genética y sus efectos en el organismo. A través de redes neuronales y modelos basados en grafos, los científicos han podido relacionar variantes del ADN con cambios en la actividad de los genes en regiones concretas del cerebro afectadas por la enfermedad. Además, el equipo ha desarrollado un método propio para “comprimir” grandes volúmenes de datos genéticos sin perder información relevante, lo que permite reducir el coste computacional y acelerar los análisis.
Los factores que modifican la enfermedad no son universales, dependen del contexto genético”
“Los factores que modifican la enfermedad no son universales, dependen del contexto genético”, señala Jordi Abante. “Gracias al aprendizaje automático podemos descubrir interacciones que antes eran prácticamente invisibles”, añade.
Más allá del caso del Huntington, los investigadores subrayan que esta metodología en un futuro podría aplicarse a otras enfermedades neurodegenerativas y hereditarias, como el Alzheimer o algunas ataxias.
