Genie 3: de pasos a saltos en la creación de escenarios envolventes gracias a la inteligencia artificial

Analizamos tan solo el principio de una poderosa herramienta de Google que cambia la forma en la que se generan ambientes virtuales.

Despertó el poder de la percepción constante en los modelos de inteligencia artificial especializados en la generación de imágen y con él, la verdad sobre el escenario en el que se ejecutará la inteligencia artificial general (AGI).

Los primeros resultados publicados por Google en los que su modelo Genie 3 demuestra la capacidad de proyectar escenarios envolventes para la navegación visual y la experiencia de usuario en entornos inmersivos son una más de las revoluciones a  las que nos acostumbraron los desarrollos de equipos de investigación en las máquinas de pensamiento artificial. 

Cada nuevo paso en los resultados de estos modelos recuerda el asombro que despierta en un adulto la maduración de las etapas mentales del niño cuando ha pasado del rayón al dibujo de un ícono o de la pronunciación de palabras a la interpretación de ellas al ritmo de una melodía. 

Hace tan solo un par de años el mundo veía con asombro, y quizá algo de temor, cómo un modelo de inteligencia artificial creaba un elemento visual o auditivo de casi cualquier cosa que los usuarios le pidieran.

Ahora Genie 3 y el entrenamiento profundo que le ha dedicado la empresa DeepMind, despertó la capacidad para generar ambientes virtuales con una calidad superior, como quizá nunca alguien se lo hubiera imaginado. Es más que un escenario estilo videojuego, es más que un entorno para sentirnos como jugadores en él. 

Es el ambiente digital creado artificialmente para implementar lo que Demis Hassabis, Director ejecutivo de Deepmind, llama los modelos de mundo. Entornos capaces de simular las leyes físicas del mundo real en el que interactúan al mismo tiempo avatares controlados por humanos y agentes IA que necesitan modelar constantemente sus procesos de pensamiento basados en datos y visualizaciones de la física natural. 

Pero más allá de poder explorar estos escenarios, es aún más sorprendente que podamos interactuar con ellos, crearlos. Solo requiere una instrucción, en otro vocabulario que quizá ya muchos empezamos a usar en nuestro día a día, un prompt, con el que esta nueva fuerza de la inteligencia artificial generará “mundos dinámicos” en los que podremos aventurarnos a 24 cuadros por segundo.

Lo que ocurre ante nuestros ojos es un bucle en el que caemos inocentemente pues le aportamos a los algoritmos de IA nuestro conocimiento, nuestras aspiraciones o nuestras limitación sin protesta alguna porque creemos que están a nuestro servicio, solo por el hecho de recibir a cambio un tipo de caramelo adictivo que son sus recompensas en forma de datos, imágenes, voces y ahora mundos.

Podemos simular los mundos más ‘reales’, los más disparatados, incluso combinarlos.

Es de interés para Comintech seguir el paso desde un costado para aportar un punto de vista sobre la inteligencia artificial y los entornos virtuales, dos conceptos que aunque aún seguimos conociendo, puesto que estos desarrollos se impondrán con mayor influencia y poder sobre la mente a través de la tecnología VR. 

En conversaciones con otros interesados por los mundos generativos y la IA, llegamos a la conclusión que Genie 3 debe ser explotado en la realidad virtual, finalmente allí vamos a convivir muy pronto las dos especies, humanos vinculados con avatares y lo que Yuval Harari ha llamado migrantes, agentes IA dispersos por todas partes. Las opciones son ilimitadas y causa emoción saber qué más nos traerá la innovación aunque desde Google, la empresa que desarrolla esta tecnología, hablan de “limitaciones” como espacio de acción limitado, la interacción y simulación de otros agentes, y la duración limitada de las interacciones en los escenarios.

En todo caso, las posibilidades en estos entornos nos llenan de una expectativa que no deja de preocupar pues este modelo es la puesta en público de la pieza fundamental de los entornos de aprendizaje en donde se moverán los agentes IA para entender las leyes de nuestro mundo.