vendredi, novembre 29, 2024

Gemini Nano de Google apporte une meilleure intelligence de description d’image à son outil de vision TalkBack

L’événement Google I/O est arrivé et la société annonce de nombreuses mises à jour intéressantes pour votre appareil Android. Comme nous l’avons entendu précédemment, Gemini Nano bénéficie d’un support multimodal, ce qui signifie que votre Android traitera toujours le texte mais avec une meilleure compréhension d’autres facteurs tels que les images, les sons et la langue parlée. Google a désormais annoncé que le nouvel outil serait également disponible dans sa fonctionnalité TalkBack.

TalkBack est un outil existant qui lit à haute voix la description d’une image, qu’il s’agisse d’une image que vous avez capturée ou d’une image provenant d’Internet. Le support multimodal de Gemini Nano devrait fournir une compréhension plus détaillée de l’image. Selon Google, les utilisateurs de TalkBack rencontrent chaque jour environ 90 images sans étiquette. Gemini Nano devrait être en mesure de fournir des informations manquantes, telles que l’apparence d’un vêtement ou les détails d’une nouvelle photo envoyée par un ami.

Gemini Nano fonctionne directement sur l’appareil d’une personne, ce qui signifie qu’il devrait toujours fonctionner correctement sans aucune connexion réseau. Bien que nous n’ayons pas encore de date exacte pour son arrivée, Google indique que TalkBack bénéficiera des fonctionnalités mises à jour de Gemini Nano plus tard cette année.

Restez informé de toutes les actualités de Google I/O 2024 directement ici!

Source-145

- Advertisement -

Latest