Meta a annoncé ce qu’il appelle une « percée » dans un domaine spécifique de l’IA de jeu : un logiciel appelé Cicero qui est la première IA à atteindre « des performances de niveau humain dans le jeu de stratégie populaire Diplomacy ». La diplomatie est à l’origine un jeu de société, qui a de nombreux successeurs numériques officiels et non officiels, et la raison pour laquelle c’est un choix si intéressant est que le cœur du jeu est la négociation : c’est un jeu multijoueur où les joueurs doivent constamment négocier avec un autre.
Le message annonçant Cicéron reconnaît diverses «victoires» de l’IA sur les humains (vérification des faits: Deep Blue a perdu contre Garry Kasparov avant de le battre plusieurs années plus tard, après quoi IBM a refusé une revanche), mais dit que «des agents vraiment utiles et polyvalents devront aller au-delà juste déplacer des pièces sur une planche ». Ainsi, Cicéron est censé être capable de négocier, de persuader et de travailler avec des acteurs humains pour atteindre des objectifs stratégiques de la même manière qu’un humain le ferait.
La diplomatie a longtemps été considérée comme l’un des grands défis de l’IA pour ces raisons. Vous devez comprendre les motivations des autres joueurs, ajuster les stratégies à la volée et finalement les gagner à vos côtés. Eh bien… Cicéron a joué sur webDiplomacy.net, une version en ligne du jeu, et « a obtenu plus du double du score moyen des joueurs humains et s’est classé parmi les 10 % des meilleurs participants qui ont joué à plus d’un jeu ».
En fait : « Cicéron est si efficace dans l’utilisation du langage naturel pour négocier avec les gens de la diplomatie qu’ils ont souvent préféré travailler avec Cicéron plutôt qu’avec d’autres participants humains. »
Trahison! Rang, faute de trahison !
Une partie de la réussite est que Cicero n’a pas été construit sur la méthode traditionnelle de renforcement de l’auto-jeu grâce à laquelle les IA apprennent des jeux (en jouant à des millions de jeux contre elle-même ou contre des humains et en analysant les données). Meta dit qu’il intègre deux éléments principaux : « le raisonnement stratégique, tel qu’utilisé dans des agents comme AlphaGo et Pluribus, et le traitement du langage naturel, tel qu’utilisé dans des modèles tels que GPT-3, BlenderBot 3, LaMDA et OPT-175B ».
Une partie particulièrement cruciale est que Cicero peut reconnaître les joueurs dont il a besoin pour gagner et proposer une stratégie pour les faire participer. Le logiciel « exécute un algorithme de planification itératif qui équilibre la cohérence du dialogue avec la rationalité », prédisant les mouvements futurs des joueurs sur la base du dialogue avant de proposer un plan qui intègre ces prédictions.
Il ne va pas encore conquérir le monde : Cicero n’est capable que de jouer à Diplomacy, bien que les ambitions de Meta pour ce logiciel s’étendent bien au-delà d’un vieux jeu de société. La société estime que cela pourrait avoir un impact important sur les assistants de chat IA, leur permettant par exemple de tenir des conversations et des dialogues d’apprentissage qui enseignent de nouvelles compétences aux humains.
« Vous pouvez également imaginer un jeu vidéo dans lequel les personnages non-joueurs (PNJ) pourraient planifier et converser comme les gens – comprendre vos motivations et adapter la conversation en conséquence – pour vous aider dans votre quête de prendre d’assaut le château. »
C’est plutôt intéressant : peut-être que le magazine Edge avait raison à propos de Doom. Et si vous pourrait parler aux monstres? Vous pouvez en savoir plus sur le côté technique de Cicero et retrouvez le document de recherche iciou regardez-le jouer contre des experts humains (s’ouvre dans un nouvel onglet).