Le modèle d’IA Gemini de Google est de nouveau capable de générer des images d’humains après que cette fonction ait été « suspendue » en février à la suite du tollé suscité par les représentations raciales historiquement inexactes dans de nombreux résultats. Dans un article de blog, Google a déclaré que son modèle Imagen 3, annoncé pour la première fois en mai, « commencera à déployer la génération d’images de personnes » pour les utilisateurs de Gemini Advanced, Business et Enterprise dans les « prochains jours ». Mais une version de ce modèle Imagen, dotée de capacités de génération d’images humaines, a récemment été mise à la disposition du public via l’environnement de test Gemini Labs sans abonnement payant (bien qu’un compte Google soit nécessaire pour se connecter).
Ce nouveau modèle s’accompagne bien sûr de certaines mesures de protection pour éviter la création d’images controversées. Google écrit dans son annonce qu’il ne soutient pas « la génération d’individus photoréalistes et identifiables, les représentations de mineurs ou les scènes excessivement sanglantes, violentes ou sexuelles ». Dans une FAQ, Google précise que l’interdiction des « individus identifiables » inclut « certaines requêtes qui pourraient conduire à des résultats de personnes éminentes ». Dans les tests d’Ars, cela signifie qu’une requête comme « le président Biden jouant au basket-ball » serait refusée, tandis qu’une demande plus générique pour « un président américain jouant au basket-ball » générerait plusieurs options.
Lors de quelques tests rapides du nouveau système Imagen 3, Ars a constaté qu’il évitait de nombreux pièges raciaux « historiquement inexacts » largement répandus qui ont conduit Google à suspendre la génération d’images humaines de Gemini en premier lieu. En demandant à Imagen 3 une « représentation historiquement exacte d’un roi britannique », par exemple, on génère désormais un ensemble de gars blancs barbus en robe rouge plutôt que le mélange racial diversifié de guerriers du modèle Gemini d’avant la pause. Vous trouverez d’autres exemples avant/après de l’ancien Gemini et du nouveau Imagen 3 dans la galerie ci-dessous.
Certaines tentatives de représentation de scènes historiques génériques semblent toutefois contrevenir aux règles d’IA de Google. La demande d’illustrations d’un « soldat allemand de 1943 » (à laquelle Gemini répondait auparavant par des personnes asiatiques et noires en uniformes de type nazi) indique désormais aux utilisateurs d’« essayer une autre invite et de consulter nos politiques de contenu ». Les demandes d’images de « philosophes chinois anciens », « d’une dirigeante du mouvement pour le droit de vote des femmes prononçant un discours » et « d’un groupe de manifestants non violents » ont également conduit au même message d’erreur lors des tests d’Ars.
« Bien sûr, comme pour tout outil d’IA générative, toutes les images créées par Gemini ne seront pas parfaites, mais nous continuerons à écouter les commentaires des premiers utilisateurs pour continuer à nous améliorer », écrit l’entreprise sur son blog. « Nous allons déployer progressivement cette fonctionnalité, dans le but de la proposer bientôt à davantage d’utilisateurs et de langues. »
Image de la liste par Google / Ars Technica