
20/04/25, 13:07:17
|
|
Noticias HTCMania
|
|
Fecha de registro: mar 2010
Mensajes: 61,110
|
|
La nueva forma de medir la inteligencia de una IA: ponerla a jugar a Pokémon
La nueva forma de medir la inteligencia de una IA: ponerla a jugar a Pokémon

Un nuevo enfoque para evaluar el verdadero nivel de inteligencia de una IA ha ganado popularidad: ponerla a jugar a videojuegos clásicos como Pokémon. La idea no es recreativa, sino funcional. El juego obliga a los modelos a adaptarse, razonar y tomar decisiones sin depender exclusivamente de información memorizada. Esta iniciativa representa un tipo de benchmark más dinámico y contextual. La tendencia comenzó con Claude 3.7 de Anthropic, que fue puesto a jugar a Pokémon Rojo mediante una interfaz de navegación autónoma. Más tarde, un desarrollador independiente decidió probar lo mismo con Gemini Pro 2.5 Experimental de Google, usando Pokémon Azul en un emulador. Aunque Gemini no cuenta con herramientas de navegación automática como Claude, su creador le ha añadido un minimapa para compensar, y de momento está avanzando con menos bloqueos. Estos videojuegos por turnos como Pokémon, o incluso el mítico Snake (utilizado por el ARC Prize Foundation), son entornos ideales: gráficos simples, ritmo pausado y necesidad de planificación. Todo ello obliga a la IA a “pensar” su siguiente paso, adaptarse al entorno y evitar errores como movimientos ilegales. A diferencia de otros test centrados en problemas conocidos, este tipo de pruebas exigen capacidad de razonamiento contextual y aprendizaje adaptativo. Esta metodología podría convertirse en una herramienta clave para desarrollar IAs más versátiles y “reales”, alejándose del clásico “memorizar y repetir”. Empresas como DeepMind ya llevan tiempo explorando esta vía, que podría redefinir lo que entendemos como inteligencia artificial general.
fuente
|