DeepMind lanza un nuevo sistema de IA capaz de jugar a la «estrategia»

Unidad DeepMind de Alphabet Inc. desarrolla un nuevo sistema de IA capaz de jugar «estrategia», un juego de mesa considerado más complejo que el ajedrez y el aire.

Mente profunda Bisagra El sistema de inteligencia artificial, denominado DeepNash, el jueves. La unidad de Alphabet dice que DeepNash tiene una tasa de victorias de más del 84% en partidos contra jugadores humanos expertos.

«Stratego» es un juego de mesa para dos jugadores que es similar en algunos aspectos al ajedrez. Los jugadores reciben un conjunto de piezas de juego, como piezas de ajedrez, que se mueven por el tablero hasta que uno de los jugadores gana. Pero hay una serie de diferencias entre los dos juegos que hacen que la estrategia sea más compleja que el ajedrez.

En «Stratego», cada jugador solo tiene información limitada sobre las piezas del juego del otro jugador. Un jugador puede saber que el otro jugador ha colocado una pieza de juego en una parte específica del tablero, pero no la pieza de juego específica que se colocó allí. Esta dinámica dificulta el juego para los sistemas de IA.

Otra fuente de complejidad es que hay más posibilidades que en el ajedrez. La cantidad de tácticas posibles que los jugadores pueden usar en un juego de mesa se mide mediante una métrica conocida como el número de complejidad del árbol del juego. El ajedrez tiene un número de complejidad del árbol del juego de 10 a la potencia 123, mientras que en «Stratego» ese número sube a 10 a la potencia 535.

READ  NRMA colabora con Julia Stone, Lifeline Australia y Thinkerbell

Según DeepMind, los enfoques tradicionales para enseñar a los sistemas de IA a jugar juegos de mesa no se pueden aplicar bien a la «estrategia» debido a su complejidad. Para abordar esta limitación, los investigadores de DeepMind han desarrollado un nuevo método de IA denominado R-NaD que se basa en el dominio matemático de la teoría de juegos. Este método forma la base del DeepNash DeepMind detallado esta semana.

Según DeepMind, DeepNash está desarrollando un plan para ganar juegos de «estrategia» simulando el llamado equilibrio de Nash. El equilibrio de Nash es la situación en la que cada jugador «estratega» utiliza la estrategia de juego que tiene la mayor probabilidad de derrotar la estrategia del otro jugador. En tal situación, ambos jugadores realizan la combinación óptima de movimientos de juego durante el partido.

Al estudiar lo que sucedería si el oponente realiza la combinación óptima de movimientos, DeepNash puede desarrollar un plan de acción que aumente sus posibilidades de ganar.

Para evaluar el rendimiento de DeepNash, DeepMind jugó una serie de partidos contra varios sistemas de IA anteriores configurados para el juego «estratégico». DeepNash ha ganado más del 97% de los partidos, según la unidad de Alphabet. En otra evaluación, DeepNash jugó una versión en línea de «Stratego» y logró una tasa de victorias del 84 % contra jugadores humanos expertos.

“Para lograr estos resultados, DeepNash demostró un comportamiento notable tanto durante la fase inicial de despliegue de piezas como en su fase de reproducción”, explicaron los investigadores de DeepMind en un comunicado. entrada en el blog. «DeepNash ha desarrollado una estrategia impredecible. Eso significa crear implementaciones iniciales que sean lo suficientemente diversas como para evitar que un oponente detecte patrones en una serie de juegos».

READ  Los usuarios de Skype en los EE. UU. ahora pueden hacer llamadas al 911 desde su PC

DeepMind cree que las técnicas de IA que desarrolló para construir DeepNash se pueden aplicar a otras tareas además de jugar «Stratego». Según el módulo Alphabet, la capacidad de un sistema de IA para desarrollar un curso de acción óptimo en situaciones complejas se puede aplicar en áreas como la gestión del tráfico.

«También esperamos que R-NaD ayude a abrir nuevas aplicaciones para la IA en campos que cuentan con una gran cantidad de participantes humanos o IA con diferentes objetivos que pueden no contener información sobre la intención de otros o lo que sucede en su entorno». explican los investigadores de DeepMind.

Imagen: DeepMind

Muestre su apoyo a nuestra misión uniéndose a nuestra comunidad de expertos Cube Club y Cube Event. Únase a la comunidad que incluye Amazon Web Services y el CEO de Amazon.com, Andy Jassy, ​​el fundador y CEO de Dell Technologies, Michael Dell, el CEO de Intel, Pat Gelsinger, y muchos más dignatarios y expertos.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *