DeepMind, la subsidiaria de Google dedicada a la inteligencia artificial, ha presentado Genie 2, un nuevo modelo de lenguaje para inteligencia artificial, que permite la creación de entornos 3D inmersivos, interactivos y controlables a partir de una única imagen generada, pensado para facilitar la producción de videojuegos.
Este nuevo modelo utiliza un enfoque de generación autoregresiva basado en una arquitectura de difusión latente, lo que le permite simular mundos virtuales ricos en detalles y responder a acciones humanas o de agentes mediante teclado y ratón (que es lo que nos interesa, porque lo de la difusión latente, cualquiera lo entiende).
Con la capacidad de mantener coherencia en las escenas durante largos periodos de tiempo, Genie 2 permite explorar interacciones complejas entre objetos, simular fenómenos físicos como gravedad o humo, y crear animaciones detalladas de personajes. Además, el modelo también puede crear desafíos variados, y métricas claras para medir el progreso.
Los entornos (mundos) creados por Genie 2 pueden ser explorados mediante una vista en primera o en tercera persona, con perspectivas isométricas o incluso simulaciones de conducción. El modelo destaca por su capacidad para generar trayectorias contrafactuales desde un mismo punto de partida.
El entorno de trabajo cuenta con la capacidad de generación de imágenes Imagen 3, que facilita que los creadores puedan describir las imágenes que deseen a través de un entorno de texto, y que el modelo las genere, mejorándolas y puliéndolas hasta que sean como ellos han imaginado, para luego utilizar estas mismas imágenes como una semilla para crear un mundo tridimensional e inmersivo completo.
Según Google, a pesar de los avances, el desarrollo de Genie 2 se encuentra en una etapa temprana, por lo que todavía tardaremos en poder ‘jugar’ con él. Ahora mismo, los investigadores buscan mejorar la consistencia y generalidad de los entornos generados, asegurándose, además, de que estas tecnologías sean útiles y seguras tanto en línea como en el mundo real.