ChatGPT a peut-être attiré l’attention du monde. Mais DeepMind, le laboratoire de recherche appartenant à Google, affirme que son prochain grand modèle de langage rivalisera – ou même mieux – avec OpenAI.
Selon un article de Wired, DeepMind utilise des techniques d’AlphaGo, le système d’intelligence artificielle de DeepMind qui a été le premier à vaincre un joueur humain professionnel au jeu de société Go, pour créer un chatbot rival de ChatGPT appelé Gemini.
Si tout se passe comme prévu, Gemini aura la capacité de planifier ou de résoudre des problèmes ainsi que d’analyser du texte, a déclaré Demis Hassabis, PDG de DeepMind, à Will Knight de Wired.
« À un niveau élevé, vous pouvez penser que Gemini combine certaines des forces des systèmes de type AlphaGo avec les incroyables capacités linguistiques des grands modèles », a déclaré Hassabis. « Nous avons également de nouvelles innovations qui vont être assez intéressantes. »
Knight spécule que Gemini, qui a été brièvement taquiné lors de la conférence des développeurs d’E/S de Google en mai, tirera parti des innovations en matière d’apprentissage par renforcement pour accomplir des tâches avec lesquelles les modèles de langage d’aujourd’hui ont du mal. L’apprentissage par renforcement consiste à « récompenser » un système d’IA pour certains comportements et/ou à punir les comportements indésirables, dans le but d’« apprendre » au système quels comportements adopter dans une situation donnée.
Comme le note Knight, l’apprentissage par renforcement a déjà conduit à des gains dans l’espace du modèle de langage – c’est la clé de la façon dont les systèmes tels que ChatGPT répondent aux invites. DeepMind, ayant une vaste expérience dans l’apprentissage par renforcement (AlphaGo en est un exemple), est sans aucun doute désireux d’appliquer ses apprentissages au domaine de l’IA générative.
Il convient de noter que Gemini n’est pas la première incursion de DeepMind dans les modèles de langage. L’année dernière, la société a présenté Sparrow, un chatbot qui, selon le laboratoire, était moins susceptible que d’autres modèles linguistiques de donner des réponses « dangereuses » ou « inappropriées » aux questions. Hassabis a déclaré à Time en janvier que DeepMind envisagerait de publier Sparrow pour une bêta privée dans le courant de l’année ; on ne sait pas si ces plans sont toujours sur la bonne voie.
Gemini est cependant le travail le plus ambitieux de DeepMind dans l’espace à ce jour, du moins si l’on en croit les premiers rapports. L’information a rapporté en mars que Gemini – qui a été stimulé par les échecs de Bard, le projet de chatbot de Google – pour suivre le rythme de ChatGPT, a une participation directe de hauts responsables de Google, y compris Jeff Dean, le plus haut responsable de la recherche sur l’IA de l’entreprise.
La course à la domination dans l’espace de l’IA générative s’accompagne d’un enthousiasme fulgurant pour les investisseurs et les clients. Selon Grand View Research, le marché de l’IA générative – y compris l’IA d’analyse de texte comme Gemini – pourrait atteindre 109,37 milliards de dollars d’ici 2030, soit une augmentation de 35,6 % par rapport à 2030.