Google apporte dès aujourd’hui son modèle d’intelligence artificielle de nouvelle génération Gemini à son chatbot Bard. La société affirme qu’elle améliorera considérablement les performances et la capacité de raisonnement de Bard, en lui donnant la capacité de comprendre les images, le texte, le code, l’audio et la vidéo de manière native.
Il y avait des spéculations sur le fait que cela serait retardé en raison de problèmes de compréhension de certaines langues, et la nouvelle version ne serait disponible qu’en anglais. Cependant, lors d’un appel à la presse, Google a déclaré aux journalistes que son système fonctionnait bien dans plusieurs langues.
Google a lancé son chatbot Bard il y a huit mois à titre expérimental et en réponse au succès de ChatGPT. Il s’agit du troisième modèle qui soutient l’outil depuis son lancement, en commençant par LaMDA, en passant par PaLM 2 au cours de l’été lors de son lancement, et maintenant Gemini.
Sissie Hsiao, vice-présidente de Google Bard, a déclaré que lors d’évaluations aveugles avec des testeurs tiers, Bard s’est révélé être le chatbot gratuit le plus préféré.
Qu’est-ce que les Gémeaux ?
Gemini est divisé en trois versions : Nano qui fonctionnera sur les appareils mobiles, Pro qui est utilisé pour alimenter Bard et Ultra qui sera lancé l’année prochaine et alimentera un nouveau Bard Advanced.
Google affirme que Gemini Pro fonctionne aussi bien, voire mieux, que GPT-3.5, le modèle d’OpenAI qui alimente la version gratuite de ChatGPT. Il ne s’appuierait pas sur la façon dont Gemini Ultra se compare à GPT-4, affirmant seulement qu’il surpasse « tous les modèles » sur des critères clés.
«Les Gémeaux peuvent comprendre le monde qui nous entoure de la même manière que nous et peuvent absorber tout type d’entrée et de sortie. Pas seulement du texte comme la plupart des modèles, mais aussi du code, de l’audio, de l’image et de la vidéo », a déclaré Demis Hassabis, PDG de Google DeepMind.
Comment cela va-t-il changer Bard ?
Bard a été progressivement amélioré depuis son lancement, avec l’ajout de quelques fonctionnalités multimodales comme l’analyse du contenu d’une image. Il s’est également doté d’extensions lui permettant de vérifier les vols, de revoir le contenu d’une vidéo YouTube ou de consulter vos emails.
Avec les Gémeaux, cela devient quelque chose de complètement nouveau. Même si cela ne semble pas différent à première vue, sous le capot se trouvera un moteur plus puissant qui, selon Google, aura de meilleures capacités dans tous les domaines – au moins à égalité avec la version gratuite de ChatGPT.
Il a été construit sur une version affinée de Gemini Pro en anglais, et d’autres langues seront disponibles au cours de la nouvelle année. Cela améliore ses capacités de raisonnement, de planification et de compréhension par rapport à la version précédente construite sur PaLM 2.
La version initiale ne fonctionnera qu’avec des invites textuelles, mais comme Gemini a été conçu dès le départ pour être multimodal, d’autres médias arriveront l’année prochaine.
Et après? Barde Avancé
L’année prochaine, Google lancera une nouvelle version de son chatbot appelée Bard Advanced. Il n’est pas encore clair s’il s’agira d’un service payant dans le même esprit que ChatGPT Plus, mais il sera alimenté par Gemini Ultra, la version la plus puissante du modèle d’IA.
Gemini Ultra a été conçu pour « des tâches très complexes et pour comprendre et agir rapidement sur différents types d’informations », fonctionnant sur les puces les plus puissantes du réseau de centres de données de Google.
Google affirme que Bard Advanced donnera accès à toutes les capacités de Gemini Ultra, mais il doit d’abord y avoir davantage de contrôles et de tests de sécurité. « Cela correspond à l’approche audacieuse et responsable que nous avons adoptée depuis le lancement de Bard », a déclaré Hsiao.
« Avec Gemini, nous nous rapprochons de notre vision de faire de Bard le meilleur collaborateur d’IA au monde », a-t-elle ajouté. « Nous sommes ravis de continuer à intégrer les dernières avancées dans Bard et de voir comment vous l’utilisez pour créer, apprendre et explorer. »
Gemini arrivera également sur Google Workspace via Duet AI au début de l’année prochaine. Cela permettra de générer du texte et des images plus détaillés avec Docs, Sheets et Slides. L’entreprise l’expérimente également dans la recherche pour accélérer les résultats et permettre des requêtes plus complexes.