AI-imager Midjourney v5 étourdit avec des images photoréalistes et des mains à 5 doigts

Agrandir / Un exemple d’effets d’éclairage et de peau dans le générateur d’images AI Midjourney v5.

Mercredi, mi-journée annoncé la version 5 de son service commercial de synthèse d’images AI, qui peut produire des images photoréalistes à un niveau de qualité que certains fans d’art AI appellent effrayant et « trop parfait. » Midjourney v5 est désormais disponible en tant que test alpha pour les clients qui s’abonnent au service Midjourney, disponible via Discord.

« MJ v5 me donne actuellement l’impression d’avoir enfin des lunettes après avoir ignoré la mauvaise vue pendant un peu trop longtemps », a déclaré Julie Wieland, une graphiste qui partage souvent ses créations Midjourney sur Twitter. « Soudain, vous voyez tout en 4k, c’est étrangement écrasant mais aussi incroyable. »

Wieland a partagé certaines de ses générations Midjourney v5 avec Ars Technica (voir ci-dessous dans une galerie et dans l’image principale ci-dessus), et elles montrent certainement une progression dans les détails de l’image depuis l’arrivée de Midjourney en mars 2022. La version 3 a fait ses débuts en août, et la version 4 a fait ses débuts en novembre. Chaque itération a ajouté plus de détails aux résultats générés, comme le montrent nos expériences :

Une comparaison entre la sortie de Midjourney v3 (à gauche), v4 (au centre) et v5 (à droite) avec l'invite
Agrandir / Une comparaison entre la sortie de Midjourney v3 (à gauche), v4 (au centre) et v5 (à droite) avec l’invite « un barbare musclé avec des armes à côté d’un téléviseur CRT, cinématique, 8K, éclairage de studio ». (Pour utiliser v5, mettez « –v 5 » à la fin de l’invite.)

Ars Technica

Midjourney fonctionne de la même manière que les synthétiseurs d’images comme Stable Diffusion et DALL-E en ce sens qu’il génère des images basées sur des descriptions textuelles appelées « invites » à l’aide d’un modèle d’IA formé sur des millions d’œuvres d’art créées par l’homme. Récemment, Midjourney était au cœur d’une controverse sur le droit d’auteur concernant une bande dessinée qui utilisait des versions antérieures du service.

Après avoir expérimenté la v5 pendant une journée, Wieland a noté des améliorations qui incluent des textures de peau et des traits du visage « incroyablement réalistes » ; éclairage plus réaliste ou cinématographique ; meilleurs reflets, reflets et ombres ; des angles plus expressifs ou des vues d’ensemble d’une scène, et « des yeux presque parfaits et plus bancaux ».

Et, bien sûr, les mains.

Au cours de l’année écoulée, l’idée que les générateurs d’art IA ne peuvent pas rendre les mains correctement est devenue un trope culturel. Notamment, Midjourney v5 peut générer assez bien des mains humaines réalistes. « Les mains sont correctes la plupart du temps, avec 5 doigts au lieu de 7-10 sur une main », a déclaré Wieland.

Dans les notes de publication Discord du service, Midjourney a également noté que la v5 répond désormais avec une « gamme stylistique beaucoup plus large » que la version 4, tout en étant plus sensible aux invites, en générant moins de texte indésirable et en offrant une résolution d’image multipliée par 2.

S’il y a un inconvénient visuel à la mise à niveau de Midjourney pour les fans d’art IA, cela vient peut-être d’images qui peuvent être si réalistes et « parfaites » que la précision du modèle enlève une partie du frisson de générer à plusieurs reprises des images IA pour trouver un résultat approprié, quoi on pourrait appeler un « effet de machine à sous ». Bien qu’un utilisateur de Twitter nommé Philipp Lenssen indiqué« Si vous avez un sujet d’image spécifique en tête, c’est toujours un peu comme la loterie. Mais avec des chances de gagner plus élevées que la v4. »

Source-147