mardi, janvier 7, 2025

« Superbe » – La mise à jour de Midjourney impressionne les artistes de l’IA avec une fonctionnalité semblable à une caméra

Agrandir / Midjourney 5.2 permet de « zoomer » sur les images de synthèse. L’image de synthèse d’origine est représentée ici dans l’encadré pointillé rouge.

À mi-parcours

Jeudi, Midjourney a dévoilé la version 5.2 de son modèle de synthèse d’images alimenté par l’IA, qui comprend une nouvelle fonctionnalité de « zoom arrière » qui permet de conserver une image synthétisée centrale tout en créant automatiquement une scène plus grande autour d’elle, simulant un zoom arrière avec un objectif de caméra.

Semblable à l’outpainting, une technique d’imagerie par IA introduite par le DALL-E 2 d’OpenAI en août 2022, la fonction de zoom arrière de Midjourney peut prendre une image existante générée par l’IA et étendre ses bordures tout en gardant son sujet d’origine centré dans la nouvelle image. Mais contrairement à DALL-E et à la fonction de remplissage génératif de Photoshop, vous ne pouvez pas sélectionner une image personnalisée à agrandir. Pour le moment, le zoom arrière de la v5.2 ne fonctionne que sur les images générées dans Midjourney, un service de génération d’images AI par abonnement.

Sur le serveur Midjourney Discord (toujours l’interface officielle de Midjourney, bien que des plans soient en cours pour changer cela), les utilisateurs peuvent expérimenter le zoom arrière en générant n’importe quelle image v5.2 (maintenant la valeur par défaut) et en mettant à l’échelle un résultat. Après cela, des boutons spéciaux « Zoom » apparaissent sous la sortie. Vous pouvez effectuer un zoom arrière d’un facteur de 1,5x, 2x ou d’une valeur personnalisée entre 1 et 2. Un autre bouton, appelé « Créer un carré », générera du matériel autour de l’image existante de manière à créer un rapport d’aspect carré de 1: 1 .

David Holz, le créateur de Midjourney, a annoncé jeudi soir les nouvelles fonctionnalités et améliorations de la v5.2 sur le serveur Discord. Outre le « zoom arrière », les ajouts les plus importants incluent un système esthétique révisé, promettant une meilleure qualité d’image et une commande « –stylize » plus forte qui influence efficacement l’aspect non réaliste d’une image. Il existe également un nouveau « mode de variation élevée », activé par défaut, qui augmente la variété de composition entre les générations d’images. De plus, une nouvelle commande « /shorten » permet aux utilisateurs d’évaluer les invites dans le but de supprimer les mots non essentiels.

Malgré le déploiement immédiat de la v5.2, Holz a souligné dans son annonce que des changements pourraient survenir sans préavis. Les anciennes versions du modèle Midjourney sont toujours disponibles en utilisant la commande « /settings » ou l’argument de commande en ligne « –v 5.1 ».

Une comparaison entre la sortie de Midjourney v3 (gauche), v4 (centre-gauche), v5 (centre-droit) et v5.2 (droite) avec l'invite
Agrandir / Une comparaison entre la sortie de Midjourney v3 (gauche), v4 (centre-gauche), v5 (centre-droit) et v5.2 (droite) avec l’invite « un barbare musclé avec des armes à côté d’un téléviseur CRT, cinématique, 8K , éclairage de studio. »

À mi-parcours

Pour les fans de cette nouvelle forme d’art de synthèse d’images parfois appelée « synthographie » par des partisans tels que Julie Wieland, les changements dans la v5.2 sont les bienvenus, certains utilisateurs de Midjourney les appelant « superbe » et « époustouflant« , qui ne sont pas des superlatifs inhabituels dans le monde hype-friendly de l’IA en ce moment. Mais les fans diraient probablement que les améliorations visuelles de Midjourney justifient l’étonnement réactions entre eux.

La dernière mise à jour fait partie d’une série d’améliorations de la qualité depuis mars 2022, lorsque le modèle a généré des images relativement mal définies qui manquaient de détails. Plus récemment, Midjourney a introduit la v5.0 en mars et la v5.1 en mai de cette année, qui ont toutes deux amélioré le réalisme et les détails de l’image. L’introduction de la série de modèles v5 a permis la création d’images réalistes du pape François et de Donald Trump qui ont suscité des inquiétudes concernant les deepfakes sur les réseaux sociaux.

Malgré l’enthousiasme suscité par les nouvelles fonctionnalités parmi les passionnés de Midjourney, la synthèse d’images reste très controversée parmi certains artistes en raison de la façon dont ces systèmes d’IA sont formés, utilisant des millions d’images récupérées sur le Web sans consultation, crédit ou autorisation de l’artiste. Midjourney n’a jamais officiellement révélé le contenu exact de ses données d’entraînement. Adobe tente une voie plus éthique avec Firefly, mais Venture Beat a récemment signalé que le consentement actif de l’artiste est encore marginal.

Pour l’instant, il est difficile de ne pas apprécier les avancées techniques révélatrices de Midjourney tout en se demandant s’il existe une voie plus éthique pour cette technologie, une voie qui plaise aux artistes, à la fois traditionnels et synthographes.

Source-147

- Advertisement -

Latest