Takuma Miyazono a commencé à conduire des voitures de course virtuelles à l’âge de 4 ans, lorsque son père a ramené à la maison le jeu de sport automobile très réaliste Gran Turismo 4. Seize ans plus tard, en 2020, Miyazono est devenu le Gran Turismo champion du monde, remportant une «triple couronne» sans précédent d’événements de course automobile d’esports. Mais il n’avait jamais fait face à un Gran Turismo pilote tout à fait comme GT Sophy, une intelligence artificielle développée par Sony et Polyphony Digital, le studio derrière le Gran Turismo la franchise.
« Sophy est très rapide, avec des temps au tour meilleurs que prévu pour les meilleurs pilotes », explique-t-il via un traducteur. « Mais en regardant Sophy, il y avait certains mouvements que je croyais seulement possibles par la suite. »
Les jeux vidéo sont devenus un bac à sable important pour la recherche sur l’IA ces dernières années, les ordinateurs maîtrisant un éventail croissant de titres. Mais Gran Turismo représente un nouveau défi important pour une machine.
Contrairement aux jeux de société maîtrisés par l’IA, comme les échecs ou le Go, Gran Turismo exige des jugements continus et des réflexes rapides. C’est beaucoup plus complexe que les jeux d’action comme Starcraft ou Dota et demande des manœuvres de conduite difficiles. UNE Gran Turismo ace doit équilibrer pousser une voiture virtuelle à ses limites et lutter contre la friction, l’aérodynamisme et les lignes de conduite précises avec la danse subtile d’essayer de dépasser un adversaire sans bloquer injustement sa ligne et encourir une pénalité.
« Surclasser les conducteurs humains avec tant d’habileté dans une compétition en face à face représente une réalisation historique pour l’IA », a déclaré Chris Gerdes, professeur à Stanford qui étudie la conduite autonome, dans un article publié mercredi aux côtés de la recherche Sony dans le journal. La nature.
Gerdes affirme que les techniques utilisées pour développer GT Sophy pourraient aider au développement de voitures autonomes. Actuellement, les voitures autonomes n’utilisent que le type d’algorithme de réseau neuronal utilisé par GT Sophy pour suivre les marquages routiers et percevoir les autres véhicules et obstacles. Le logiciel contrôlant la voiture est écrit à la main. « Le succès de GT Sophy sur la piste suggère que les réseaux de neurones pourraient un jour jouer un rôle plus important dans le logiciel des véhicules automatisés qu’ils ne le font aujourd’hui », écrit Gerdes.
Sony a annoncé en 2020 qu’il développait un prototype de voiture électrique doté de fonctionnalités avancées d’assistance à la conduite. Mais la société affirme qu’il n’est pas encore prévu d’utiliser GT Sophy dans ses efforts automobiles.
GT Sophy montre également à quel point les environnements simulés sont devenus importants pour les systèmes d’IA du monde réel. De nombreuses entreprises développant une technologie de conduite autonome utilisent des simulations informatiques sophistiquées pour générer des données de formation pour leurs algorithmes. Par exemple, Waymo, la société de voitures autonomes appartenant à Alphabet, affirme que ses véhicules ont parcouru l’équivalent de 20 millions de kilomètres dans des simulations.
« L’utilisation de l’apprentissage automatique et du contrôle autonome pour la course est passionnante », déclare Avinash Balachandran, directeur principal de la recherche sur la conduite centrée sur l’homme au Toyota Research Institute, qui teste des voitures autonomes capables de fonctionner à des vitesses extrêmes. Il dit que Toyota travaille sur « l’amplification humaine, dans laquelle les technologies qui tirent parti des connaissances d’experts du sport automobile peuvent un jour améliorer les systèmes de sécurité active ».
Bruno Castro da Silva, professeur à l’Université du Massachusetts à Amherst qui étudie l’apprentissage par renforcement, qualifie GT Sophy de « réalisation impressionnante » et d’une étape importante vers la formation de systèmes d’IA pour les véhicules autonomes. Mais da Silva dit que passer de Gran Turismo au monde réel sera difficile, car il est difficile pour les algorithmes d’apprentissage par renforcement tels que GT Sophy de prendre en compte les implications à long terme des décisions, et parce qu’il est difficile de garantir la sécurité ou la fiabilité de ces algorithmes.