Les humains ont une grande tradition d’affronter l’intelligence artificielle dans une bataille d’esprit, et cela ne se termine généralement pas bien. En 1997, Deep Blue d’IBM a battu le maître d’échecs Garry Kasparov, tandis qu’en 2016, le champion de Go Lee Sedol a été battu par l’ordinateur bien nommé AlphaGo. Même le monde du Mahjong a été secoué lorsque Microsoft a introduit en 2019 une IA nommée Suphx, capable de battre les meilleurs joueurs du monde.
Malheureusement, la tendance de l’IA à surpasser ses adversaires en chair et en os semble se poursuivre sans relâche.
Des chercheurs de l’Université des sciences et du design de Singapour (SUTD) viennent de révéler un nouveau logiciel capable de comprendre la conception complexe de mouvements. Les scientifiques ont utilisé l’apprentissage par renforcement (RL) pour entraîner son intelligence artificielle – ce qui signifie en gros l’entraîner via des tests sur des personnes plutôt que de la laisser se déchaîner sur un ensemble de données (apprentissage supervisé).
La voie à suivre pour ces tests n’était autre que le classique du jeu vidéo des années 90, Street Fighter II: Championship Edition.
L’équipe de recherche a initialement fourni à l’ordinateur des millions de mouvements initiaux pour créer un programme de conception de mouvements. Le programme a ensuite fait plusieurs essais pour améliorer chaque mouvement de manière aléatoire vers un objectif spécifique. Enfin, il a peaufiné les mouvements des personnages ou ajusté sa stratégie jusqu’à ce qu’il apprenne à effectuer des mouvements qui surpassent l’IA intégrée.
Une fois les roues d’entraînement retirées après quelques jours, la machine a confortablement frappé un joueur humain et a utilisé ce retour d’information complexe pour s’améliorer davantage. Comme une version numérique du Veximok de Donjons et Dragons.
En plus d’humilier les fans de jeux rétro, cette IA a des implications plus larges pour la science du mouvement et d’autres jeux de stratégie comme les échecs. En un mot, cette IA peut observer et analyser les schémas de mouvements humains avant de les reproduire et éventuellement de les surpasser. Il y a une pensée réconfortante pour vous.
Les chercheurs ont noté de nombreuses bonnes qualités pour mesurer le succès du système de conception, telles qu’une étiquette de jeu raisonnable, la gestion des informations inexactes, la capacité à atteindre des états de jeu spécifiques et les délais courts nécessaires pour vaincre les adversaires.
« Plus la technologie devient efficace, plus elle ouvre d’applications potentielles, y compris la progression continue des tâches compétitives que les ordinateurs peuvent faciliter pour les meilleurs joueurs, comme au Poker, Starcraft et Jeopardy », a déclaré l’enquêteur principal Desmond Loke, associé. Professeur, SUTD. « Nous pourrions également assister à une compétition réaliste de haut niveau pour entraîner des joueurs professionnels, découvrir de nouvelles tactiques et rendre les jeux vidéo plus intéressants. »
Si vous êtes intéressé, vous pouvez lire le document de recherche complet ici.