Les chercheurs de DeepMind ont utilisé le jeu de cuisine chaotique Overcooked (s’ouvre dans un nouvel onglet) apprendre à l’IA à mieux collaborer avec les humains. Les chercheurs du MIT ont emboîté le pas, offrant à leur IA la capacité de faire la distinction entre un large éventail de styles de jeu. Ce qui est étonnant, c’est que cela fonctionne réellement – les humains impliqués ont en fait préféré jouer avec l’IA.
Avez-vous déjà été plongé dans un jeu avec des inconnus pour découvrir que leur style de jeu bouleverse totalement le vôtre ? Il y a une raison pour laquelle nous jouons mieux avec des gens que nous connaissons : ils nous comprennent. En équipe, vous vous efforcez de compléter le style de jeu de chacun afin de pouvoir couvrir toutes les bases et gagner.
Généralement, le seul objectif d’un modèle d’IA dans le jeu est de maximiser son score final, foutre le reste. C’est pourquoi l’IA est excellente dans les jeux compétitifs en solo, mais pas tellement dans la collaboration. Comme nous le savons, il y a plus à gagner quand il s’agit de coopération.
Les chercheurs de DeepMind ont lancé ce qu’ils appellent l’IA de «co-jeu fictif (FCP)» dans des sessions Overcooked avec des humains et de «nouveaux agents», ou une IA inconnue qui a été formée sur des algorithmes distincts.
Essentiellement, il utilise un ensemble beaucoup plus diversifié pour apprendre. Dans leurs découvertes (s’ouvre dans un nouvel onglet) (avertissement PDF) ils ont vu les scores monter en flèche grâce à cette nouvelle méthode d’entraînement, et les partenaires humains ont même exprimé « une forte préférence subjective à s’associer avec des agents FCP ».
Des chercheurs du MIT ont expérimenté une méthode similaire (s’ouvre dans un nouvel onglet), inspiré par les découvertes de DeepMind. Ils sont allés plus loin avec leur nouveau modèle « Any-Play », élargissant les critères en demandant à l’IA d’identifier correctement le style de jeu de son partenaire d’entraînement, afin qu’elle puisse mieux s’adapter pour le bien de l’équipe. Plutôt que de simplement maximiser le score, ce qui semble être l’objectif de la plupart des boneheads que je rencontre via le matchmaking en ligne.
Des expériences précédentes qui associaient des humains à des coéquipiers d’IA, comme celle du Lincoln Laboratory (s’ouvre dans un nouvel onglet) chercheurs, ont clairement indiqué que les humains voient souvent l’IA comme un coéquipier « déroutant et imprévisible ». Ces nouvelles méthodes, cependant, pourraient vous voir un jour être remplacé par une IA, si votre style de jeu ne correspond pas à celui de vos coéquipiers.