Google prévoit d’intégrer les techniques d’un système d’intelligence artificielle conçu pour gagner des parties du jeu de société complexe, Go, afin d’étoffer son grand modèle de langage de nouvelle génération et de rivaliser avec ChatGPT d’OpenAI.
Le nouveau grand modèle linguistique (LLM), connu sous le nom de Gemini, exploitera le système d’IA gagnant pour tirer parti de ses compétences en apprentissage par renforcement. Cela devrait offrir des améliorations dans les tâches avec lesquelles les LLM actuels, comme ChatGPT ou Google’s Bard, peuvent avoir du mal ou ouvrir de nouvelles opportunités pour son utilisation.
« À un niveau élevé, vous pouvez penser que Gemini combine certaines des forces des systèmes de type AlphaGo avec les incroyables capacités linguistiques des grands modèles », déclare Demis Hassabis, PDG de Google DeepMind, dans un article de Wired.
Depuis avril de cette année, DeepMind a fusionné avec la propre équipe d’IA interne de Google pour créer Google DeepMind.
Google a initialement acquis DeepMind en 2014 après avoir montré que son modèle d’IA, connu sous le nom d’AlphaGo, était le meilleur chien d’un jeu de société extrêmement complexe appelé Go. Peu de temps après, en 2016, AlphaGo a battu le champion de l’époque, Lee Sedol, dans quatre matchs sur cinq.
Plus tard, Lee s’est entièrement retiré du jeu, car il a affirmé que l’IA « ne peut pas être vaincue ».
Lee n’avait pas tout à fait raison dans cette hypothèse, car Kellin Pelgrine a vaincu une autre IA jouant au Go, KataGo, par 14 matchs contre 15 plus tôt cette année. Bien que Pelgrine ait été assistée par une IA qui a repéré les faiblesses de KataGo, il s’agit peut-être davantage d’une victoire à la Pyrrhus pour nous, humains charnus.
Ce qui intéresse donc le développement LLM de Google, c’est la façon dont AlphaGo utilise l’apprentissage par renforcement pour devenir un adversaire redoutable. Il s’agit essentiellement d’un système à travers lequel il fait des tentatives et reçoit des commentaires sur ses performances, ce qui, combiné à la capacité de cartographier de nombreux mouvements possibles dans un jeu, l’a finalement conduit à vaincre un adversaire avec une maîtrise du jeu.
Combinez cette compétence avec les moyens d’un LLM pour extraire des informations d’Internet et les régurgiter dans un langage à consonance naturelle et vous pourriez être sur un outil d’IA plus intelligent que ceux qui existent aujourd’hui. C’est du moins la conviction de Google, car il suggère que ce type de nouveau raisonnement et de renforcement pourrait aider ses modèles d’IA à rattraper enfin le ChatGPT dominant d’OpenAI.
Bien que Gemini soit encore en cours de développement et qu’il sera probablement développé beaucoup plus longtemps avant qu’il ne soit prêt pour une large diffusion.