jeudi, décembre 19, 2024

Google déploie un chat IA à commande vocale pour les utilisateurs Android

Agrandir / Le logo Google Gemini.

Google

Jeudi, Google a mis à disposition gratuitement Gemini Live, sa fonctionnalité de chatbot IA basée sur la voix, pour tous les utilisateurs d’Android. Cette fonctionnalité permet aux utilisateurs d’interagir avec Gemini via des commandes vocales sur leurs appareils Android. C’est remarquable car la fonctionnalité Advanced Voice Mode de ChatGPT du concurrent OpenAI, qui est similaire à Gemini Live, n’est pas encore entièrement disponible.

Google a dévoilé Gemini Live lors de son événement de lancement du Pixel 9 le mois dernier. Au départ, la fonctionnalité était réservée aux abonnés Gemini Advanced, mais elle est désormais accessible à toute personne utilisant l’application Gemini ou sa superposition sur Android.

Gemini Live permet aux utilisateurs de poser des questions à voix haute et même d’interrompre les réponses de l’IA au milieu d’une phrase. Les utilisateurs peuvent choisir parmi plusieurs options vocales pour les réponses de Gemini, ajoutant ainsi un niveau de personnalisation à l’interaction.

Gemini suggère les utilisations suivantes du mode vocal dans ses documents d’aide officiels :

Parlez en va-et-vient : Parlez à Gemini sans taper et Gemini vous répondra verbalement.
Réfléchissez à voix haute à vos idées : Demandez-nous une idée de cadeau, de planification d’un événement ou de réalisation d’un business plan.
Explorer: Découvrez plus de détails sur les sujets qui vous intéressent.
Entraînez-vous à voix haute : Répétez les moments importants de manière plus naturelle et conversationnelle.

Il est intéressant de noter qu’OpenAI a initialement présenté son mode vocal avancé en mai lors du lancement de GPT-4o, mais qu’il n’a proposé cette fonctionnalité qu’à un nombre limité d’utilisateurs à partir de fin juillet. Certains experts en IA pensent qu’un déploiement plus large a été entravé par un manque de puissance informatique disponible, car la fonction vocale est vraisemblablement très gourmande en ressources de calcul.

Pour accéder à Gemini Live, les utilisateurs peuvent appuyer sur une nouvelle icône de forme d’onde dans le coin inférieur droit de l’application ou de la superposition. Cette action active le microphone, permettant aux utilisateurs de poser des questions verbalement. L’interface comprend des options permettant de « suspendre » la réponse de Gemini ou de « terminer » la conversation, ce qui donne aux utilisateurs le contrôle du déroulement de l’interaction.

Actuellement, Gemini Live ne prend en charge que l’anglais, mais Google a annoncé son intention d’étendre la prise en charge des langues à l’avenir. La société a également l’intention d’intégrer cette fonctionnalité aux appareils iOS, bien qu’aucun calendrier précis n’ait été fourni pour cette extension.

Source-147

- Advertisement -

Latest