Por primera vez, una inteligencia artificial no se limita a producir imágenes fugaces, sino universos digitales que persisten durante y evolucionan con cierta lógica interna. Todo eso es lo que propone Genie 3, el nuevo modelo de Google DeepMind, que abre la puerta a una forma distinta de crear mundos virtuales para videojuegos, educación o simulaciones científicas.
Las dos primeras versiones de Genie ya habían mostrado el potencial de generar entornos interactivos a partir de texto, pero con limitaciones claras: apenas duraban entre 10 y 20 segundos antes de desvanecerse. Genie 3, presentado el pasado agosto, cambia esa dinámica. Ahora es capaz de mantener escenarios a 24 fotogramas por segundo en resolución 720p, con coherencia visual sostenida durante varios minutos y objetos que permanecen en memoria más allá de un instante.
“Podemos generar tanto mundos fotorrealistas como mundos imaginarios, y todo lo que existe entre ambos”, explicó Demis Hassabis, CEO de DeepMind, al presentar el nuevo modelo en redes sociales. Para él, Genie 3 representa un salto fundamental en la forma de entender la inteligencia artificial aplicada a la creación de entornos digitales.

Imágenes de los mundos interactivos generados por Genie 3.
Así lo resumió Hassabis lo resumió en una entrevista de PC Gamer: “Básicamente, tienes una IA jugando en la mente de otra IA”. En la práctica, se trata de un sistema que permite a un agente de IA interactuar dentro de un mundo generado por otra, lo que convierte la simulación en un espacio de prueba realista y flexible.
Pero este avance no se limita al aspecto gráfico. Genie 3 introduce propiedades físicas y la posibilidad de modificar entornos en tiempo real mediante instrucciones sencillas. Con un prompt de texto es posible cambiar el clima, añadir animales o introducir objetos de todo tipo.
“Desde paisajes fotorrealistas hasta reinos de fantasía, las posibilidades son infinitas”, sintetizaba la cuenta oficial de Google DeepMind en X. La clave está en que los mundos generados no son estáticos, sino que admiten variaciones continuas en función de lo que el usuario decida explorar.
El blog de la compañía señala que los elementos de estos entornos persisten alrededor de un minuto en la memoria visual del modelo, lo que garantiza cierta estabilidad y continuidad, un requisito básico para que los mundos se perciban como espacios navegables y no solo como secuencias inconexas.
Aunque el sector del videojuego es el campo de pruebas natural para Genie 3, sus aplicaciones van mucho más allá. El modelo puede servir para educación inmersiva, reconstrucciones históricas, creación artística o entrenamiento de robots en entornos simulados antes de enfrentarse al mundo real. Hassabis insiste en que este tipo de herramientas no son simples experimentos gráficos, sino un paso hacia ecosistemas creativos donde la interacción con la IA adquiere una nueva dimensión.