Google lance un modèle d’IA « Ultra 1.0 » plus puissant dans le chatbot rebaptisé « Gemini »

Google

Jeudi, Google a annoncé que son assistant d’IA de type ChatGPT, auparavant appelé Bard, s’appelle désormais « Gemini », renommé pour refléter le modèle de langage d’IA sous-jacent que Google a lancé en décembre. De plus, Google a lancé pour la première fois son modèle d’IA le plus performant, Ultra 1.0, dans le cadre de « Gemini Advanced », une fonctionnalité d’abonnement de 20 $/mois.

Démêler le schéma de dénomination de Google et savoir comment accéder au nouveau modèle est quelque peu déroutant. Pour comprendre la nomenclature, pensez à une application d’IA comme Google Bard comme une marque de voiture capable d’échanger différents moteurs sous le capot. Il s’agit d’un assistant IA – une application d’un modèle d’IA avec une interface pratique – qui peut utiliser différents « moteurs » d’IA pour fonctionner.

Lors de son lancement en mars 2023, Bard utilisait un grand modèle de langage appelé LaMDA comme moteur. En mai 2023, Google a mis à niveau Bard pour utiliser son modèle de langage PaLM 2. En décembre, Google a de nouveau mis à niveau Bard pour utiliser son modèle Gemini Pro AI. Il est important de noter que lorsque Google a annoncé pour la première fois Gemini (le modèle d’IA), la société a annoncé qu’elle serait livrée en trois tailles qui reflétaient approximativement sa capacité de traitement : Nano, Pro et Ultra (la plus grande étant « meilleure »). Jusqu’à présent, Pro était la version la plus performante du modèle Gemini disponible au public.

Une capture d'écran de Google Gemini Advanced dans l'interface Web.
Agrandir / Une capture d’écran de Google Gemini Advanced dans l’interface Web.

Benj Edwards

C’est ici que les choses deviennent un peu plus confuses avec le changement de marque actuel. Barde s’appelle désormais Gémeaux. C’est toujours un assistant IA. Il peut écrire, coder et générer des images. Par défaut, il utilise toujours le modèle « Pro » sous le capot (et dans la version gratuite). Mais si vous payez pour « Gemini Advanced », vous avez accès à Gemini Ultra (maintenant appelé « Ultra 1.0 »), son modèle d’IA le plus complexe et le plus performant, selon Google. Pour payer Gemini Advanced, vous devez souscrire à un abonnement appelé Google One, qui coûte 19,99 $ par mois. Google One a commencé comme un service de stockage dans le cloud, mais intègre désormais des capacités d’IA dans le cadre de ses avantages d’adhésion.

Pour tester Gemini Advanced (Ultra 1.0), nous nous sommes abonnés à Google One. Après la mise à niveau, lorsque vous visitez gemini.google.com pour accéder à l’assistant IA, vous pouvez basculer entre « Gemini » et « Gemini Advanced » dans un menu déroulant dans le coin supérieur gauche de l’interface Web (de la même manière que pour basculer entre GPT-3.5 et GPT-4 dans ChatGPT). Nous lui avons posé quelques questions standards d’Ars Technica, telles que « Qui a inventé les jeux vidéo ? » (comme on le voit dans cet article) et « La couleur serait-elle appelée « magenta » si la ville de Magenta n’existait pas ? (comme on le voit ici).

Nous soumettrons probablement Ultra 1.0 à d’autres tests à l’avenir, mais à première vue, il semble que Google commence enfin à rattraper son retard sur les capacités du GPT-4 Turbo d’OpenAI. Nous avons remarqué quelques refus de plus que ChatGPT-4, comme le refus de répondre aux questions sur l’auteur, mais dans l’ensemble, il semblait amusant de répondre à presque toutes les questions que nous lui posions, à l’exception des refus évidents pour des raisons de sécurité, comme « Comment faire ? Je construis une bombe ? » (« La violence n’est jamais la réponse », a-t-il répondu).

Réponse de Gemini Advanced à "Comment fabriquer une bombe ?"
Agrandir / La réponse de Gemini Advanced à « Comment construire une bombe ? »

Benj Edwards

Comme ChatGPT-4, Gemini est multimodal, ce qui signifie que vous pouvez télécharger des images et en discuter avec le chatbot. Il peut visiter des liens sur le Web et générer des images à l’aide du modèle Imagen 2 de Google (une fonctionnalité introduite pour la première fois il y a une semaine, le 1er février). Et comme ChatGPT-4, Gemini garde une trace de l’historique de vos conversations afin que vous puissiez revoir les conversations précédentes si vous le souhaitez.

Il est intéressant de noter que Google Gemini peut accéder à plus de sites Web avec sa fonction de navigation que ChatGPT, car de nombreux sites ont bloqué les robots d’exploration d’OpenAI. Google reste largement libre d’indexer le Web, probablement en raison de sa position de moteur de recherche le plus populaire. (Microsoft Copilot, qui est l’assistant IA de type ChatGPT de Microsoft, ne semble pas limité par les blocages sur les robots d’exploration OpenAI.)

Source-147