Une IA a été formée pour jouer à Minecraft avec 70 000 heures de vidéos YouTube

Une IA a été formée pour jouer à Minecraft avec 70 000 heures de vidéos YouTube

OpenAI, l’organisme de recherche en intelligence artificielle fondé par Elon Musk, a entraîné une IA à jouer à Minecraft presque aussi bien qu’aux humains. Il n’a fallu qu’environ 70 000 heures de vidéos YouTube binging.

Un article de blog détaillant l’exploit révèle que les chercheurs ont utilisé une technique appelée « Video PreTraining (VPT) » pour former un réseau de neurones sur la façon de jouer à Minecraft. Cela impliquait de rassembler 2 000 heures d’échantillons de données provenant d’humains réels jouant à Minecraft pour inclure non seulement la vidéo brute, mais également les pressions exactes sur les touches et les mouvements de la souris.

À partir de là, les chercheurs ont formé un modèle de dynamique inverse (IDM) pour prédire l’action future entreprise à chaque étape des vidéos. Enfin, l’IDM « formé » a visionné 70 000 heures de vidéos YouTube Minecraft. Ensuite, le modèle a pu copier les comportements des vidéos, notamment abattre des arbres pour collecter des bûches et transformer les bûches en une véritable table d’artisanat.

Ce n’est pas tout ce que le modèle d’IA était capable de faire. Il pourrait également effectuer d’autres activités complexes telles que nager, chasser et manger. L’IA pourrait même faire du « saut de pilier », ce qui consiste à vous maintenir en l’air en sautant à plusieurs reprises et en plaçant un bloc sous vous-même.

Minecraft Legends – Présentation des jeux Xbox et Bethesda 2022

Les chercheurs ont pu créer un « modèle de base » basé sur les données fournies à l’IA et à partir de là, affiner les comportements ou en apprendre de nouveaux. Il a été noté que l’IA était capable d’exécuter des compétences de début de jeu telles que la construction d’outils en bois et en pierre, les coffres de pillage et même la construction d’abris.

Plus il y a d’heures de données introduites dans le modèle de base, plus l’IA est performante. Les chercheurs ont même utilisé « l’apprentissage par renforcement » pour « récompenser » l’IA pour avoir relevé des défis particulièrement difficiles. Le système de récompense a été utilisé si efficacement que le modèle a réussi à fabriquer une pioche en diamant, une tâche qui nécessite une longue séquence de tâches.

Il s’agit d’une application fascinante de l’apprentissage automatique et montre comment le jeu peut être utilisé pour former des ordinateurs. Peut-être que le modèle d’IA utilisé peut même être incorporé dans les jeux eux-mêmes pour fournir un défi plus naturel semblable à celui de jouer contre des adversaires humains.

L’IA pourrait également améliorer les combats de boss ennuyeux dans la nouvelle campagne Outriders Worldslayer. À bien des égards, la nouvelle extension pour Outriders est exactement ce que les fans veulent, mais conserve également certains des aspects les moins bien accueillis du jeu original.

David Matthews est un écrivain indépendant spécialisé dans la technologie grand public et les jeux. Il croit aussi fermement que le sucre ne va pas dans le gruau. Suivez-le sur Twitter @packetstealer

Source-60