OpenAI, la start-up de recherche en IA, a annoncé (s’ouvre dans un nouvel onglet) DALL·E 2, une mise à jour de son générateur de texte en image qui ressemble à un sérieux pas en avant.
Essentiellement, DALL·E 2 peut créer de l’art à partir d’une entrée en langage naturel, telle que : « une peinture d’un renard assis dans un champ au lever du soleil dans le style de Claude Monet ». OpenAI indique que l’objectif est de créer « des images et des œuvres d’art originales et réalistes » qui peuvent « combiner des concepts, des attributs et des styles ».
C’est un exploit vraiment impressionnant pour une entreprise qui s’est lancée dans diverses initiatives d’IA, y compris GPT-3 (s’ouvre dans un nouvel onglet)qui peut générer une prose assez remarquable.
Le document de recherche d’accompagnement d’OpenAI donne beaucoup plus de détails sur le fonctionnement de DALL·E 2. En utilisant les modèles contrastifs CLIP, DALL·E 2 s’exécute en deux étapes : la première crée une image CLIP intégrée avec une légende de texte et la seconde génère une image basée sur celle-ci.
Les résultats sont très impressionnants et pourraient avoir de grandes ramifications pour l’industrie de l’art et de la conception graphique, en particulier pour les studios de jeux vidéo, qui emploient actuellement des concepteurs pour construire minutieusement des mondes et des concepts.
DALL·E 2 s’appuie sur le travail effectué par OpenAI avec DALL·E 1, qui a été annoncé (s’ouvre dans un nouvel onglet) en janvier 2021. Le nom est une combinaison de Salvador Dalí et WALL·E.
Un nouveau monde courageux
OpenAI est l’une des startups les plus excitantes travaillant actuellement dans le domaine de l’IA.
Fondée en 2015 par Elon Musk, Sam Altman, Ilya Sutskever et d’autres, l’objectif est de produire une « IA conviviale » qui profite à l’humanité dans son ensemble. La startup, qui est une organisation à but non lucratif, est en concurrence avec DeepMind d’Alphabet.
DALL·E 2 est un très bon exemple de ce travail dans la pratique, repoussant les limites de ce qui est possible lorsqu’il s’agit de générer des images à l’aide de l’IA. Le service peut même éditer des images existantes selon les spécifications d’un utilisateur.
Il y a, bien sûr, un long chemin à parcourir. Les chercheurs ont noté que ses fondations CLIP peuvent facilement être trompées en étiquetant un élément comme un autre. Mais au fil du temps, ces défauts seront résolus et améliorés.
OpenAI prévoit de publier prochainement DALL·E 2 pour sélectionner des chercheurs.