Microsoft prend le courant de la génération d’images d’IA, se promenant dans le champ de mines de l’éthique

Agrandir / Un aperçu de la fonction texte-image de l’IA de Microsoft Designer, qui peut générer des images à partir d’invites écrites.

Microsoft

Lors d’un événement de presse Surface aujourd’hui, Microsoft a annoncé l’intégration de la technologie de génération d’images basée sur l’IA dans son moteur de recherche Bing, son navigateur Edge et une nouvelle application Office appelée Microsoft Designer. La technologie sera alimentée par DALL-E 2 par OpenAI, qui a fait des vagues en avril pour sa capacité à générer de nouvelles images basées sur des invites écrites. La technologie a également fait l’objet d’ire chez certains artistes en raison de préoccupations éthiques.

Les offres de Microsoft visent à aider les créateurs à surmonter le syndrome de la page blanche en suggérant des plans d’action créatifs. Dans un exemple de Microsoft Designer fourni par Microsoft, quelqu’un tape une description de ce qu’il veut voir, comme « Gâteau ombré décoré de fleurs et de feuillage d’automne », et il peut ensuite faire défiler des exemples d’images générées par l’IA qu’il peut choisir de ajouter à leur conception. « Le concepteur vous invite à commencer par une idée et à laisser l’IA faire le gros du travail », a écrit Microsoft dans un communiqué de presse.

Un aperçu GIF animé de l'application Microsoft Designer "Commencer à partir de zéro" fonctionnalité, fournie par Microsoft.
Agrandir / Un aperçu GIF animé de la fonctionnalité « Start From Scratch » de l’application Microsoft Designer, fournie par Microsoft.

Microsoft

Microsoft Designer est né dans le cadre de PowerPoint, où il suggère actuellement des idées de conception en tant que sous-ensemble de ce programme. Mais Microsoft prévoit d’intégrer Designer dans sa propre application Microsoft 365 qui sera disponible à la fois en tant qu’application gratuite et en tant qu’application premium disponible pour les abonnés Microsoft 365 Personal et Family. Pour l’instant, Microsoft limite Designer à une application Web publique gratuite, qu’il utilisera pour recueillir les commentaires des tests publics.

Un aperçu GIF animé d'Image Creator de Microsoft Bing, fourni par Microsoft.

Un aperçu GIF animé d’Image Creator de Microsoft Bing, fourni par Microsoft.

Microsoft

Microsoft a également annoncé qu’il intégrera Designer dans Microsoft Edge pour fournir « des suggestions de conception basées sur l’IA pour améliorer visuellement les publications sur les réseaux sociaux et d’autres contenus visuels sans avoir à quitter la fenêtre de votre navigateur ». Et la synthèse d’images par IA arrivera également sur Bing avec Image Creator, où les gens pourront taper une invite et obtenir un nouveau résultat, alimenté par le DALL-E 2 d’OpenAI.

L’éléphant éthique dans la chambre

Depuis qu’OpenAI a lancé DALL-E 2 en avril, la génération d’images d’IA a été controversée par certains artistes en raison de son fonctionnement. Les modèles de synthèse d’images comme DALL-E 2 utilisent des réseaux neuronaux d’apprentissage en profondeur pour analyser des millions ou des milliards d’images trouvées publiquement sur le Web sans demander le consentement des artistes ou des titulaires de droits d’auteur. Ces modèles, y compris le concurrent DALL-E Stable Diffusion, associent statistiquement le contenu de ces images à des légendes descriptives trouvées sur le Web pour les associer à des mots. Le résultat est que ces modèles peuvent générer des images basées sur des descriptions textuelles et ils peuvent imiter les styles distinctifs d’artistes humains spécifiques.

De plus, les créateurs de ces modèles de synthèse d’images avertissent qu’ils reflètent les préjugés sociaux tels que le racisme et le sexisme dans leurs données de formation, et qu’ils sont également capables de produire des images dérangeantes ou illégales si des garanties ne sont pas mises en place. Microsoft indique qu’il s’attaque à ces problèmes : « Pour empêcher DALL∙E 2 de fournir des résultats inappropriés via l’application Designer et Image Creator, nous travaillons nous-mêmes et avec notre partenaire OpenAI, qui a développé DALL-E 2, pour prendre des mesures et nous allons continuer à faire évoluer notre approche selon les besoins. »

Les mesures d’atténuation incluent la suppression « du contenu sexuel et violent le plus explicite » de l’ensemble de données de formation et l’ajout de filtres pour « limiter la génération d’images qui violent la politique de contenu ». En ce qui concerne les préjugés, Microsoft mentionne l’application d’une « technologie supplémentaire qui aide à fournir des images plus diversifiées à nos résultats », ce qui est probablement le même que les injections rapides aléatoires diverses qu’OpenAI a introduites dans DALL-E en juillet, qui ont elles-mêmes suscité une certaine controverse. Peut-être à cause de ces problèmes, Microsoft adopte une approche de libération lente au lieu d’ouvrir complètement les portes.

« Nous adoptons une approche mesurée pour déployer [Image Creator] », a écrit Microsoft dans un communiqué de presse. « Nous commencerons bientôt avec un aperçu limité pour certaines zones géographiques, ce qui nous permettra de recueillir des commentaires, d’appliquer les apprentissages et d’améliorer l’expérience avant de nous développer davantage. »

Avec ces mouvements de Microsoft, les outils de synthèse d’images deviennent rapidement plus courants. Toile ajoutée capacités de génération de texte en image à la mi-septembre.

Source-147