Bénédicte Salvetat Rey

Google presentó esta semana AlphaGenome, una nueva herramienta de inteligencia artificial (IA) desarrollada por su laboratorio DeepMind, que promete avanzar de forma decisiva en la comprensión del genoma humano, en particular del vasto territorio del ADN no codificante, responsable de regular la actividad de los genes dentro de las células.

Presentado en la revista Nature, AlphaGenome fue descrito como un modelo capaz de analizar extensas secuencias de ADN y predecir cómo pequeñas variaciones genéticas influyen en múltiples procesos biológicos fundamentales, desde la activación génica hasta la organización de la cromatina.

“La secuenciación del genoma humano nos dio el libro de la vida, pero leerlo sigue siendo un desafío”, afirmó Pushmeet Kohli, vicepresidente de investigación de Google DeepMind, durante la presentación del modelo. “Tenemos el texto, pero comprender la gramática que gobierna la vida constituye la próxima gran frontera de la biología”.

El desafío del ADN no codificante

El genoma humano está compuesto por aproximadamente 3 mil millones de pares de nucleótidos —A, T, C y G—, pero solo alrededor del 2% de estas secuencias codifican directamente proteínas, las moléculas esenciales para el funcionamiento de los organismos vivos.

El 98% restante, conocido como ADN no codificante, actúa como un sofisticado sistema de regulación genética. Estas regiones funcionan como:

Interruptores

Amplificadores

Silenciadores

que determinan cuándo, dónde y en qué cantidad se expresan los genes en cada tipo celular.

Durante años, estas secuencias fueron consideradas “ADN basura”, pero hoy se sabe que albergan la mayoría de las variantes genéticas asociadas a enfermedades complejas, como cáncer, diabetes, trastornos cardiovasculares y enfermedades neurodegenerativas.

Cómo funciona AlphaGenome

AlphaGenome fue diseñado precisamente para estudiar este componente regulador del genoma, complementando otros modelos desarrollados por DeepMind, como AlphaFold —que revolucionó la biología estructural y fue reconocido con el Premio Nobel de Química en 2024—, AlphaMissense, enfocado en variantes codificantes, y AlphaProteo, orientado al diseño de proteínas.

El nuevo modelo utiliza aprendizaje profundo, una técnica de IA basada en redes neuronales capaces de identificar patrones complejos a gran escala. Fue entrenado con datos experimentales provenientes de consorcios públicos internacionales que analizaron cientos de tipos celulares y tejidos en humanos y ratones, incluyendo información:

Epigenómica

Transcriptómica

De accesibilidad del ADN

Según sus desarrolladores, AlphaGenome puede procesar secuencias de hasta un millón de pares de nucleótidos, una longitud crucial para comprender el entorno regulador completo de un gen. Este equilibrio entre escala y precisión había sido una limitación importante en modelos anteriores.

Otro avance destacado es que el modelo puede analizar de forma simultánea la influencia de una secuencia de ADN sobre once procesos biológicos distintos, reduciendo la necesidad de múltiples herramientas especializadas.

Impacto científico y advertencias

Desde su fase de prueba, AlphaGenome ha sido utilizado por cerca de 3 mil científicos en más de 160 países. Google anunció que el modelo ya está disponible en código abierto para investigación no comercial, con la expectativa de que la comunidad científica lo amplíe con nuevos datos y aplicaciones.

Científicos mexicanos logran secuenciar genoma del coronavirus

Para investigadores externos, el avance es significativo, aunque no exento de cautela. El rendimiento de los modelos de IA, señalan, depende directamente de la calidad y diversidad de los datos de entrenamiento, que aún son limitados y poco representativos de la diversidad genética global.

También se advierte que la expresión génica está influida por factores ambientales complejos, por lo que AlphaGenome no debe considerarse una solución definitiva, sino una herramienta fundamental de apoyo para estudiar y simular las bases genéticas de enfermedades complejas.

Un paso más tras el Proyecto Genoma Humano

El lanzamiento de AlphaGenome se inscribe en la trayectoria iniciada tras el Proyecto Genoma Humano, que concluyó en 2003 luego de 13 años de trabajo internacional. Aunque ese proyecto logró identificar la secuencia completa del ADN humano, dejó pendiente la interpretación funcional de la mayor parte del genoma.

De acuerdo con el National Human Genome Research Institute, más del 90% de las variantes genéticas asociadas a enfermedades complejas se localizan en regiones no codificantes, un desafío que consorcios como ENCODE y Roadmap Epigenomics han abordado durante la última década.

En este contexto, AlphaGenome se posiciona como una herramienta clave para la investigación básica y traslacional, con el potencial de reducir tiempos y costos en el estudio de enfermedades genéticas. No obstante, su aplicación clínica directa requerirá validaciones experimentales extensas y conjuntos de datos más inclusivos, una necesidad señalada por organismos como la Organización Mundial de la Salud y el Wellcome Trust.

Aun así, para muchos científicos, AlphaGenome marca un punto de inflexión en el intento de descifrar la gramática del genoma humano, acercando a la ciencia a una comprensión más profunda de cómo el ADN regula la vida y la enfermedad.

