Vous voulez une diffusion stable en HD ? Ce générateur d’art AI offre

txt2imghd

Les générateurs d’images AI font fureur ces jours-ci, mais la plupart d’entre eux se limitent à créer des images à basse résolution, ou le matériel manque de mémoire vidéo. Il y a maintenant (au moins) un correctif pour cela : une version modifiée de Stable Diffusion appelée « txt2imghd ».

Le nouveau projet txt2imghd est basé sur le mode « GOBIG » d’un autre ramification de Stable Diffusion, qui à son tour est le modèle utilisé pour créer la plupart de l’art de l’IA que vous avez probablement vu récemment. Les images créées avec txt2imghd peuvent être plus grandes que celles créées avec la plupart des autres générateurs – les images de démonstration sont 1536 × 1536, tandis que Stable Diffusion est généralement limitée à 1024 × 768, et la valeur par défaut pour Midjourney est 512 × 512 (avec mise à l’échelle facultative à 1664 x 1664).

Image générée avec invite : "Photo de main en gros plan de 55 mm d'une majestueuse et magnifique femme mage rousse blindée tenant une petite boule de feu dans sa main lors d'une nuit enneigée dans le village.  zoom sur la main.  se concentrer sur la main.  ddl.  bokeh.  art de greg rutkowski et luis royo.  ultra réaliste.  extrêmement détaillée.  nikond850.  post-traitement cinématographique."
Image générée par txt2imghd

Txt2imghd a une manière intelligente de mettre à l’échelle les images. Selon la documentation du projet, il « crée des images détaillées à plus haute résolution en générant d’abord une image à partir d’une invite, en la mettant à l’échelle, puis en exécutant img2img sur de plus petits morceaux de l’image mise à l’échelle, et en mélangeant le résultat dans l’image d’origine ». C’est une solution intelligente pour contourner les limites des cartes vidéo, mais comme vous vous en doutez, le résultat prend plus de temps à générer qu’une seule image basse résolution.

La version mise à jour a à peu près les mêmes exigences système que Stable Diffusion standard, qui recommande une carte graphique avec au moins 10 Go de mémoire vidéo (VRAM). Si vous souhaitez l’essayer, vous pouvez exécuter le modèle dans votre navigateur (un compte GitHub gratuit est requis). Vous pouvez également télécharger le code à exécuter sur votre propre ordinateur à partir du lien source ci-dessous.

Source : GitHub


Source-135