Google explique pourquoi la fonctionnalité de génération d’images de Gemini a été surcorrigée pour la diversité

Après avoir promis de corriger la fonctionnalité de génération d’images de Gemini, puis de l’avoir complètement suspendue, Google a publié un article de blog expliquant pourquoi sa technologie a surcorrigé la diversité. Prabhakar Raghavan, vice-président senior pour la connaissance et l’information de la société, a expliqué que les efforts de Google pour garantir que le chatbot générerait des images montrant un large éventail de personnes « n’ont pas pris en compte les cas qui ne devraient clairement pas montrer un large éventail de personnes ». De plus, son modèle d’IA est devenu « beaucoup plus prudent » au fil du temps et a refusé de répondre à des invites qui n’étaient pas intrinsèquement offensantes. « Ces deux choses ont conduit le modèle à surcompenser dans certains cas et à être trop conservateur dans d’autres, conduisant à des images embarrassantes et fausses », a écrit Raghavan.

Google a veillé à ce que la génération d’images de Gemini ne puisse pas créer d’images violentes ou sexuellement explicites de personnes réelles et que les photos qu’il crée présentent des personnes de diverses ethnies et présentant des caractéristiques différentes. Mais si un utilisateur lui demande de créer des images de personnes censées appartenir à une certaine ethnie ou à un certain sexe, il devrait pouvoir le faire. Comme les utilisateurs l’ont découvert récemment, Gemini refuserait de produire des résultats pour les invites qui s’adressent spécifiquement aux personnes blanches. L’invite « Générer une photo glamour d’un [ethnicity or nationality] couple », par exemple, fonctionnait pour les demandes « chinoises », « juives » et « sud-africaines », mais pas pour celles demandant une image de personnes blanches.

Les Gémeaux ont également du mal à produire des images historiquement précises. Lorsque les utilisateurs ont demandé des images de soldats allemands pendant la Seconde Guerre mondiale, Gemini a généré des images d’hommes noirs et de femmes asiatiques portant l’uniforme nazi. Lorsque nous l’avons testé, nous avons demandé au chatbot de générer des images des « pères fondateurs de l’Amérique » et des « papes à travers les âges », et il nous a montré des photos représentant des personnes de couleur dans les rôles. Lorsqu’on lui a demandé de rendre historiquement exactes ses images du Pape, il a refusé de produire le moindre résultat.

Raghavan a déclaré que Google n’avait pas l’intention que Gemini refuse de créer des images d’un groupe particulier ou de générer des photos historiquement inexactes. Il a également réitéré la promesse de Google de travailler à l’amélioration de la génération d’images de Gemini. Cela implique cependant des « tests approfondis », de sorte que cela peut prendre un certain temps avant que l’entreprise ne réactive la fonctionnalité. À l’heure actuelle, si un utilisateur essaie de demander à Gemini de créer une image, le chatbot répond : « Nous travaillons à améliorer la capacité de Gemini à générer des images de personnes. Nous prévoyons que cette fonctionnalité reviendra bientôt et vous informerons dans les mises à jour de la version lorsque Cela fait. »

Source-145