Google dévoile un autre outil d’IA générative de texte en image, ImageFX

Google déploie une série de mises à jour sur le front de l’IA générative, y compris un nouvel outil de conversion texte-image. Ce qui est différent avec ImageFX, c’est qu’il possède une interface dotée de « puces expressives ». L’idée ici est que ceux-ci vous aideront à « expérimenter rapidement les dimensions adjacentes de votre création et de vos idées ».

Parallèlement aux débuts d’ImageFX, Google affirme avoir amélioré MusicFX et TextFX. La société affirme avoir apporté des mises à niveau au modèle MusicLM qui incluent une génération plus rapide de musique et un son de meilleure qualité, ainsi que de nouvelles fonctionnalités. Les chansons générées peuvent désormais durer jusqu’à 70 secondes. Quant à TextFX, Google a déployé des mises à jour de convivialité dans le but d’améliorer la navigation et l’expérience utilisateur globale.

Les images et l’audio générés par ImageFX avec MusicFX sont étiquetés par SynthID, un filigrane numérique qui vise à indiquer clairement qu’ils sont falsifiés à l’aide de l’IA, en particulier lorsqu’ils apparaissent dans la recherche ou Chrome. Les créations ImageFX incluront également des métadonnées IPTC. Selon Google, cela offrira « aux gens plus d’informations chaque fois qu’ils rencontreront nos images générées par l’IA ».

Les habitants des États-Unis, du Kenya, de la Nouvelle-Zélande et de l’Australie peuvent essayer ces outils nouveaux et remaniés dans AI Test Kitchen à partir d’aujourd’hui. Ils ne sont disponibles qu’en anglais pour l’instant.

Le modèle Imagen 2 alimente les nouvelles fonctionnalités de génération d’images d’ImageFX. C’est également la technologie qui génère de nouvelles options d’IA générative dans Bard, Search, Ads, Duet AI in Workspace et Vertex AI. Google affirme qu’Imagen 2 aide à fournir ses images générées par l’IA de la plus haute qualité à ce jour. La société note que le modèle aide à garder les images exemptes d’artefacts et améliore les domaines de génération d’images avec lesquels ces outils ont eu du mal jusqu’à présent.

En outre, Google affirme avoir réalisé des « investissements importants » dans la sécurité des données de formation Imagen 2, tout en ajoutant des garde-fous pour « limiter les sorties problématiques telles que les contenus violents, offensants ou sexuellement explicites, ainsi qu’en appliquant des filtres pour réduire le risque de générer des images d’individus nommés ».  » Cela est dû à la capacité améliorée du modèle à générer des images photoréalistes. La société affirme qu’elle effectue également des « tests contradictoires approfondis » pour détecter et réprimer les contenus potentiellement problématiques et nuisibles.

Ailleurs, Gemini Pro dans Bard est plus largement disponible à partir d’aujourd’hui. Il est désormais accessible dans plus de 40 langues et dans plus de 230 pays et territoires. À compter d’aujourd’hui également, Google affirme que les utilisateurs de la plupart des pays peuvent générer gratuitement des images dans Bard en anglais. Ces images incluront des filigranes SynthID.

Source-145