lundi, décembre 23, 2024

La prochaine version de Stable Diffusion ne produira pas de mains spaghetti

La prochaine version du générateur d’images AI basé sur des invites, Stable Diffusion, produira des images plus photoréalistes et sera plus efficace pour faire des mains. SDXL 0.9, un suivi de Stable Diffusion XL, « produit des détails d’image et de composition considérablement améliorés par rapport à son prédécesseur » selon Stability AI. L’annonce est apparue dans un article de blog supprimé depuis et a été rapportée par Bloomberg.

Stability AI décrit le nouveau modèle comme offrant « un bond en avant dans les cas d’utilisation créatifs pour l’imagerie IA générative ». Des exemples d’images inclus dans le billet de blog ont révélé des progrès lors de l’utilisation des mêmes invites dans la version bêta de Stable Diffusion XL et SDXL 0.9. Les images générées avec le nouveau modèle – y compris des extraterrestres, un loup et une personne tenant une tasse de café – semblent montrer des détails plus fins et des mains plus convaincantes. Les mains étaient un moyen facile de repérer l’art généré par l’IA – du moins jusqu’à Midjourney v5, une plate-forme rivale qui fonctionne sur Discord, lancée en mars.

IA de stabilité

« Malgré sa capacité à être exécuté sur un ordinateur domestique standard, SDXL 0.9 présente un bond en avant dans les cas d’utilisation créatifs pour l’imagerie IA générative », a déclaré Stability AI. « La capacité de générer des créations hyperréalistes pour les films, la télévision, la musique et les vidéos pédagogiques, ainsi que d’offrir des avancées pour la conception et l’utilisation industrielle, place SDXL à l’avant-garde des applications du monde réel pour l’imagerie IA. »

Stability AI écrit que « l’augmentation significative du nombre de paramètres du nouveau modèle (la somme de tous les poids et biais du réseau neuronal sur lequel le modèle est formé) » permet d’améliorer les résultats. L’exécution de SDXL 0.9 localement sur un PC nécessite un minimum de 16 Go de RAM et une carte graphique GeForce RTX 20 (ou supérieure) avec 8 Go de VRAM. Il prend en charge Windows 11/10 et Linux.

Exemples d'images en écran partagé d'une photo d'un loup générée par l'IA
Gauche : SDXL Beta, Droite : SDXL 0.9

IA de stabilité

Selon le billet de blog supprimé, le modèle sera bientôt disponible sur l’outil Web Clipdrop de Stability AI et sera ajouté à l’application DreamStudio de la startup. La startup indique que la version open-source de SDXL 1.0 arrivera à la mi-juillet.

Source-145

- Advertisement -

Latest