El último agente de inteligencia artificial de Google está aprendiendo a navegar en un espacio familiar: los juegos.
El gigante tecnológico publicó el miércoles una nueva investigación sobre su agente escalable multimundo, o SIMA. Este agente puede seguir instrucciones para realizar tareas en videojuegos y jugar juegos nunca antes vistos.
Pero, al igual que Genie, que DeepMind, el brazo de investigación de IA de Google, analizó en un artículo publicado el 23 de febrero, SIMA es un proyecto de investigación.
«En el futuro podríamos tener agentes como SIMA jugando junto a ti», dijo Tim Harley, ingeniero de investigación de DeepMind que codirigió el proyecto. “Agentes útiles con los que puedes hablar y dirigirles para que hagan diferentes cosas en el juego contigo mientras viajas”.
DeepMind dice que su interés en los videojuegos se debe en parte a que son un buen campo de entrenamiento para los sistemas de inteligencia artificial. La empresa de IA espera que investigaciones como ésta le permitan “comprender cómo los sistemas de IA pueden volverse más útiles”.
Desde que OpenAI lanzó ChatGPT en noviembre de 2022, el mercado se ha visto inundado de herramientas de inteligencia artificial generativa de Microsoft, Google, Adobe, Meta y Anthropic. Recientemente, la IA generativa se ha expandido más allá de la escritura para incluir fotografías, vídeos, música y, por supuesto, juegos, a medida que las empresas de tecnología buscan diferenciar sus ofertas en este floreciente espacio.
objetivos de la investigación
Según Harley, SIMA está entrenada para hacer lo que le dicen, lo que no necesariamente significa ganar.
Inicialmente, las principales preguntas de los investigadores eran si un agente de IA podría transferir habilidades entre juegos y cómo se comportaría en un juego al que nunca antes había jugado.
«Estos objetivos vienen en lenguaje natural gratuito y de código abierto de algunos usuarios humanos y luego [SIMA] «Funciona en estos entornos de videojuegos simplemente usando la interfaz natural del juego», dijo Harley. «La única forma en que un agente puede monitorear estos juegos es simplemente desde la pantalla en tiempo real».
un ejercicio
Los investigadores registraron imágenes y entradas de teclado y mouse de jugadores humanos y utilizaron técnicas de aprendizaje por imitación para enseñar a SIMA a jugar juegos como No Man's Sky, Eco, Teardown y Goat Simulator como humanos.
Evaluaron al agente en 600 habilidades, incluida la navegación (como «girar a la izquierda»), la interacción con objetos («subir la escalera») y el uso del menú («abrir el mapa») y descubrieron que SIMA se desempeñó mejor que los especialistas en juegos.
«Es capaz de aprovechar los conceptos comunes de los juegos, aprender mejores habilidades y aprender a ejecutar mejor esas instrucciones», dijo Frederic Pace, ingeniero de investigación de DeepMind. «Ver una transferencia positiva entre juegos es un hito importante para la investigación».
Pero SIMA no es perfecta.
«Todos los errores que vemos tienen que ver con una comprensión precisa», dijo Harley. «Entonces, si le pedimos a un cliente que tale un árbol en Valheim, irá y talará un árbol, pero no podemos decir exactamente cuál».
Se muestra reacio a llamar «alucinaciones» a los defectos de SIMA.
Y añadió: «A menudo, lo que vemos cuando un cliente falla… No puedo llamarlo alucinaciones. Su comportamiento a menudo parece intencional, pero no logra llevar a cabo el comportamiento necesario».
«Gran campo de entrenamiento»
A partir de aquí, DeepMind espera mejorar el rendimiento de SIMA, lo que incluye hacer que sus agentes puedan seguir instrucciones más detalladas y, eventualmente, desarrollar sistemas de inteligencia artificial «que puedan operar en tantos entornos como sea posible y lograr una variedad de objetivos además de hablar con el usuario». » “Dijo Pace.
Pero no se trata sólo de la comunicación entre humanos y agentes en los juegos.
«Creemos que los juegos y las simulaciones en general proporcionan un excelente campo de entrenamiento para los sistemas de inteligencia artificial», dijo Pace.
Esto se debe en parte a que los juegos son una aproximación al mundo real. Tienen diversidad visual, junto con diversos escenarios, mecánicas y estilos gráficos. Pero también comparten temas comunes, como navegar en espacios complejos e interactuar con objetos, personajes y jugadores.
«Adicto a la música. Gurú del café. Especialista en zombis. Defensor de las redes sociales. Introvertido. Aficionado extremo a la comida. Evangelista del alcohol».