Un nuevo modelo de inteligencia artificial, popEVE, transforma la forma en que se interpretan las mutaciones responsables de enfermedades raras del desarrollo. La herramienta, fruto de un proyecto internacional coliderado por la Escuela de Medicina de Harvard y el Centre de Regulació Genòmica (CRG) de Barcelona, permite predecir con precisión qué variantes genéticas son realmente patogénicas. Gracias a esta capacidad comparativa, ha revelado más de cien genes nunca antes asociados a estas patologías, abriendo vías de diagnóstico para miles de familias que llevan años sin respuesta.
A diferencia de los modelos tradicionales —que analizan las variantes genéticas gen a gen— popEVE estudia todo el proteoma humano, lo que permite comparar el impacto relativo de mutaciones situadas en proteínas distintas. Este enfoque global surgió al constatar que las herramientas existentes no podían priorizar correctamente las variantes cuando se analiza el exoma completo de un paciente, un paso crucial para determinar la causa de una enfermedad rara.
Un modelo para todo el proteoma humano
Los investigadores, que presentan su estudio hoy en Nature Genetics, combinaron millones de secuencias proteicas procedentes de múltiples especies con patrones de variación genética humana, integrados mediante modelos evolutivos y datos poblacionales. Este diseño obligó a entrenar un modelo independiente para cada uno de los aproximadamente 20.000 genes del genoma.
Según la coautora Mafalda Dias, del CRG, una de las motivaciones principales fue que “las clínicas no siempre tienen acceso al ADN de los padres y muchos pacientes acuden solos”.
Una vez entrenado, popEVE asigna a todas las posibles mutaciones una puntuación continua de gravedad que permite compararlas entre proteínas distintas. Esto ofrece una resolución mucho más fina para diferenciar variantes claramente dañinas de aquellas cuyo impacto es marginal. En la práctica, supone una mejora sustancial en la detección de mutaciones que antes quedaban clasificadas como de “significado incierto”.
Esta capacidad explica por qué, al aplicarlo a los datos de más de 31.000 familias con enfermedades del desarrollo, el modelo ha podido identificar 123 genes nuevos no vinculados a estas enfermedades, algunos implicados en funciones esenciales del desarrollo embrionario.
El bioinformático Alfonso Valencia, profesor ICREA y director de Ciencias de la Vida en el Barcelona Supercomputing Center, destaca en declaraciones a SMC España la relevancia de este avance. “En un solo paciente coexisten miles de variantes genéticas, lo que dificulta determinar cuáles pueden ser causantes de enfermedad. Este es uno de los grandes campos donde la inteligencia artificial está teniendo un impacto directo”.
Añade que popEVE demuestra una capacidad para identificar mutaciones asociadas a la enfermedad “con una precisión casi perfecta”, incluso sin información genética de los padres.
De variantes dudosas a diagnósticos decisivos
Una de las innovaciones más destacadas de popEVE es su diseño para reducir los sesgos asociados al origen ancestral. A diferencia de otros modelos, no penaliza variantes que sean raras en Europa, lo que evita resultados confusos o alarmistas en personas de ascendencia africana, latinoamericana o asiática. “Desarrollamos el modelo pensando precisamente en estos pacientes”, explica Jonathan Frazer, coautor principal del trabajo e investigador del CRG. “Nos aseguramos de que solo pudiera usar los datos poblacionales de una manera que minimizara el sesgo, y análisis independientes confirman que debería funcionar igual de bien para cualquier persona, en cualquier parte del mundo”.
Para facilitar su adopción global, los autores han hecho la herramienta completamente abierta, acompañada de una web consultable que permite explorar las predicciones para millones de mutaciones. Esta estrategia está diseñada para que hospitales con menos recursos puedan beneficiarse del modelo sin necesidad de grandes infraestructuras. Y esa apertura ya empieza a dar frutos.
Frazer explica a Guyana Guardian que el modelo está siendo empleado por el neurólogo clínico Pedro Rodríguez Cruz, que atiende a pacientes con enfermedades neuromusculares y neurogenéticas en Senegal. En uno de los casos, un niño con un cuadro grave de debilidad muscular tenía una mutación que otros modelos consideraban benigna. “PopEVE la clasificó como altamente patogénica”, relata Frazer. El gen afectado causa una deficiencia tratable con riboflavina, lo que permitió priorizar esa variante y ajustar el tratamiento.
En otro caso, la herramienta ayudó a reclasificar como probablemente patogénica una mutación inicialmente considerada dudosa y la relacionó con un síndrome que afecta tanto al cerebro como a los riñones. Esto motivó revisar el historial clínico y acabó confirmando síntomas renales que no se habían tenido en cuenta.
Tras la publicación del estudio, varios hospitales y laboratorios han solicitado colaborar con los autores, que ya han iniciado nuevos proyectos con equipos clínicos en España y el Reino Unido. Aunque popEVE no sustituye la interpretación médica ni el análisis clínico, el equipo lo considera un primer paso hacia modelos más comparables, menos sesgados y más útiles para pacientes de cualquier origen.


