OpenAI a lancé une mise à jour majeure pour ChatGPT, permettant la génération d’images directement dans l’interface de chat. Les utilisateurs peuvent créer et modifier des images, avec une attention particulière à la qualité et au respect des limites éthiques. Accessible progressivement à divers groupes d’utilisateurs, cette fonctionnalité utilise le modèle GPT-4o. Malgré quelques défis liés aux droits d’auteur et à la censure, les retours des utilisateurs sont enthousiastes, et des améliorations sont attendues pour corriger les anomalies signalées.
La Révolution de la Génération d’Images par ChatGPT
Après une attente prolongée de plus d’un an, OpenAI a introduit une mise à jour significative pour ChatGPT, intégrant des fonctionnalités de génération d’images. Cette annonce a été faite lors d’un livestream récent, où la société d’intelligence artificielle a révélé que les utilisateurs peuvent désormais créer des images détaillées directement à partir de l’interface de chat.
Les nouvelles capacités de génération d’images permettent non seulement de créer des œuvres entièrement nouvelles mais aussi de modifier des images existantes. OpenAI assure que ChatGPT a amélioré sa capacité à rendre le texte et à suivre les instructions, tout en utilisant le contexte de manière plus intelligente.
Accessibilité et Innovations Futures
Cette fonctionnalité sera déployée progressivement pour les utilisateurs Free, Plus, Team et Pro, et devrait également être accessible prochainement aux utilisateurs Enterprise et Education. Par ailleurs, les capacités de génération d’images peuvent être utilisées via l’outil de texte à vidéo d’OpenAI, Sora.
Lors de la présentation, Sam Altman, le PDG d’OpenAI, a exprimé son incrédulité face à la qualité des images générées par l’IA. Il a déclaré : « Ceci marque une étape importante pour nous, en offrant une liberté créative. Les utilisateurs vont réaliser des créations vraiment impressionnantes, tout en veillant à ce que l’outil ne produise pas de contenu offensant, sauf si cela est voulu. Nous pensons qu’il est essentiel de laisser cette liberté et ce contrôle aux utilisateurs, tout en restant attentifs aux limites que la société choisira. »
Les nouvelles capacités de génération d’images sont alimentées par le modèle GPT-4o d’OpenAI. Bien que ce modèle prenne un peu plus de temps que Dall-e 3 pour créer des images précises et détaillées, il a été formé sur des données accessibles au public, y compris des contenus protégés par des droits d’auteur grâce à des partenariats avec des entreprises comme Shutterstock.
Depuis son lancement, les utilisateurs se sont précipités sur les réseaux sociaux pour partager leur enthousiasme concernant ces nouvelles fonctionnalités. Cependant, il est important de noter que les outils de génération d’images basés sur l’IA font face à de nombreux défis, allant des violations de droits d’auteur à des problèmes de censure qui peuvent limiter leur créativité.
Un utilisateur de Reddit a récemment fait une découverte fascinante, révélant que l’outil de ChatGPT pouvait générer un verre de vin rempli à ras bord. En revanche, un rapport a souligné une anomalie dans l’outil, qui semblait ne pouvoir créer que des images d’hommes sexy, laissant de côté les représentations féminines. Un ingénieur logiciel a expliqué que cela était dû au contexte et à l’interprétation du contenu en matière de sexualisation.
Bien que ce problème ait été signalé, Sam Altman a assuré qu’il s’agissait d’un simple bug qui sera corrigé prochainement. La mise à jour de génération d’images de ChatGPT est prometteuse et marque un tournant dans la façon dont nous interagissons avec l’intelligence artificielle.