DeepMind réutilise les IA de jeu pour optimiser le code et l’infrastructure

La série d’IA Alpha de DeepMind a fourni quelques premières mondiales, comme AlphaGo battant le champion du monde à Go. Maintenant, ces IA formées à l’origine pour jouer à des jeux ont été mises au travail sur d’autres tâches et font preuve d’une facilité surprenante pour elles.

À l’origine, AlphaGo a été formé en utilisant un gameplay humain, puis AlphaGo Zero n’a appris qu’en jouant contre lui-même, puis AlphaZero a fait de même mais a également maîtrisé les échecs et le shogi. MuZero a fait tout cela et plus encore sans même connaître les règles du jeu, ce qui, si vous y réfléchissez, peut limiter la façon dont il « réfléchit » à la manière d’accomplir sa tâche.

Chez Google, un système appelé Borg gère l’attribution des tâches dans les centres de données – essentiellement l’analyse des demandes et l’allocation des ressources à la vitesse de la lumière afin que l’énorme entreprise de technologie puisse effectuer des travaux et des recherches à grande échelle. Mais Borg « utilise des règles codées manuellement pour planifier les tâches afin de gérer cette charge de travail. À l’échelle de Google, ces règles codées manuellement ne peuvent pas tenir compte de la variété des distributions de charge de travail en constante évolution », créant des inefficacités aussi logiquement inévitables que difficiles à suivre.

Mais AlphaZero, exposé aux données Borg, a commencé à identifier des modèles d’utilisation du centre de données et des tâches entrantes, et a produit de nouvelles façons de prévoir et de gérer cette charge. Appliqué en production, il « réduit[d] la quantité de matériel sous-utilisé jusqu’à 19 % », ce qui semble un peu choisi, mais même si c’est à moitié vrai, c’est une énorme amélioration « à l’échelle de Google ».

De même, MuZero a été mis au travail en examinant les flux YouTube pour voir s’il pouvait aider à la compression, un domaine logiciel complexe qui donne de grands résultats pour de petites optimisations. Il aurait été en mesure de réduire le débit binaire des vidéos de 4 %, ce qui, encore une fois, à l’échelle de YouTube, est assez important. MuZero se lance même dans les mauvaises herbes de la compression, comme le groupement de cadres.

AlphaDev – un parent d’AlphaZero – a également amélioré les algorithmes de tri par rapport aux algorithmes standard de la bibliothèque que Google utilisait. Et il a amélioré la fonction de hachage pour les petites plages d’octets (9-16), réduisant la charge de 30 %.

Ces améliorations ne vont pas changer le monde à elles seules ; des modifications incrémentielles des systèmes de développement sont apportées tout le temps. Ce qui est intéressant, c’est qu’une IA qui a développé une méthode de résolution de problèmes axée sur les jeux gagnants a pu apprendre et généraliser son approche dans des domaines totalement indépendants comme la compression.

Il reste encore un long, très long chemin à parcourir avant d’avoir une « IA à usage général », quoi que cela signifie vraiment, mais il est prometteur qu’il y ait une certaine flexibilité dans celles que nous avons déjà créées. Non seulement parce que nous pouvons les appliquer à différents domaines, mais parce que cela suggère flexibilité et robustesse dans les domaines dans lesquels ils travaillent déjà.

Source-146