La compañía de investigación en inteligencia artificial (IA) Google DeepMind ha anunciado el lanzamiento de AlphaGenome, que presenta como “una IA para comprender mejor el genoma”.
El sistema, de acceso gratuito para científicos de todo el mundo, predice cómo pequeños cambios en el genoma afectan a la actividad de los genes. Se trata de uno de los mayores problemas de la biología, que se ha descifrado caso por caso para algunas mutaciones puntuales, pero para lo que aún no existe una comprensión sistemática.
Google DeepMind ya abordó hace cinco años otro gran problema científico con AlphaFold, una IA que predice la forma tridimensional de una proteína a partir de su secuencia genética, escrita en el ADN. Por aquel avance que ha transformado la biología, Demis Hassabis, fundador y consejero delegado de Google DeepMind, ha recibido el premio Nobel.

Demis Hassabis, consejero delegado de Google DeepMind y coautor de la nueva investigación
El reto de AlphaGenome, en cuyo desarrollo también ha participado Hassabis, es mucho mayor. A diferencia de AlphaFold, donde hay una única respuesta correcta para cada secuencia genética, en el caso de AlphaGenome puede haber diferentes efectos para unos mismos cambios en el genoma.
El modelo “aún no ha solucionado la regulación genética al mismo nivel que AlphaFold ha solucionado la predicción de estructuras de proteínas tridimensionles”, advierte Anshul Kundaje, biólogo computacional de la Universidad de Stanford que ya ha tenido acceso a AlphaGenome, en declaraciones recogidas por Nature. Pero “es un salto adelante”, añade Kundaje. “Es una mejora genuina respecto a todos los modelos actuales más avanzados de secuencia a función”.
“De secuencia a función” significa que los modelos de IA predicen la función biológica a partir de la secuencia genética. La mayoría de los modelos actuales se han centrado se han centrado en una función concreta, como predecir el nivel de expresión de un gen o bien predecir como un mismo gen puede producir diferentes proteínas.
La novedad de AlphaGenome es que intenta predecir cualquier función, no una sola, y que lo hace a partir de secuencias genéticas de hasta un millón de letras (o pares de bases) de longitud. Esto lo convierte en el mejor modelo para explorar el llamado genoma oscuro, es decir, el 98% del genoma que no tiene genes, pero sí instrucciones que regulan el funcionamiento de los genes.
AlphaGenome es de libre acceso para la comunidad científica para investigaciones no comerciales
Por ejemplo, el equipo de Google DeepMind ha probado la capacidad de AlphaGenome de predecir los efectos de diferentes mutaciones identificadas en personas con leucemia. El modelo ha predicho correctamente que estas mutaciones, ubicadas en el genoma oscuro, activan de manera indirecta un gen promotor de la leucemia.
“AlphaGenome supone un avance fundacional hacia el gran objetivo científico de descifrar los complejos procesos celulares codificados en la secuencia de ADN”, escriben los creadores del modelo en el artículo científico en que presentan el avance, accesible como prepublicación.
Google DeepMind reconoce que el sistema tiene limitaciones y aún debe perfeccionarse
El equipo de Google DeepMind reconoce que el modelo aún tiene margen de mejora. Señala, como una de sus limitaciones, que no interpreta cómo los cambios que se producen constantemente en las células influyen a la relación entre secuencia genética y función biológica. Advierten asimismo que el modelo no se ha diseñado para interpretar el genoma individual de una persona sino para investigar más a fondo cómo funciona el genoma.
El modelo es de acceso gratuito para científicos que desarrollen investigaciones no comerciales. “Creemos que AlphaGenome puede ser un recurso valioso para la comunidad científica”, destaca Google DeepMind en un comunicado. “Puede ayudar a comprender mejor el funcionamiento del genoma y la biología de enfermedades, y conducir a nuevos descubrimientos biológicos y el desarrollo de nuevos tratamientos”.