mercredi, novembre 20, 2024

Les chuchoteurs professionnels de l’IA ont lancé un marché pour les invites DALL-E

Au cours des dernières années, l’art créé par des programmes comme Midjourney et DALL-E d’OpenAI est devenu étonnamment convaincant. Ces programmes peuvent traduire une invite de texte en art littéralement (et controversé) primé. Au fur et à mesure que les outils deviennent plus sophistiqués, ces invites sont devenues un métier à part entière. Et comme pour tout autre artisanat, certains créateurs ont commencé à les mettre en vente.

PromptBase est au centre du nouveau commerce des invites pour générer des images spécifiques à partir de générateurs d’images, une sorte de méta-marché de l’art. Lancé plus tôt cet été pour à la fois intrigue et critique, la plate-forme permet aux « ingénieurs rapides » de vendre des descriptions textuelles qui produisent de manière fiable un certain style artistique ou sujet sur une plate-forme d’IA spécifique. Lorsque vous achetez l’invite, vous obtenez une chaîne de mots que vous collez dans Midjourney, DALL-E ou un autre système auquel vous avez accès. Le résultat (si c’est une bonne invite) est une variation sur un thème visuel comme conceptions d’art d’ongle, pin-up d’animeou « succulentes futuristes. »

Les résultats d'une invite de nail art DALL-E.

Les résultats d’une invite de nail art DALL-E.
PromptBase

Les invites sont plus complexes que quelques mots de description. Ils incluent des mots-clés décrivant l’esthétique souhaitée, les éléments importants d’une scène et des crochets où les acheteurs peuvent ajouter leurs propres variables pour personnaliser le contenu. Quelque chose comme la conception de l’art des ongles peut inclure les positions des mains, l’angle de la prise de vue pseudo-photographique et des instructions pour ajuster l’invite afin de produire différents styles et thèmes de manucure. PromptBase prend une commission de 20 % et les auteurs d’invites conservent la propriété de leur travail – bien que le statut de copyright de l’art et des invites de l’IA soit en grande partie non testé.

Payer 2 $ à 5 $ pour un paragraphe de texte peut sembler un achat étrange, et l’idée d’invites payantes ne s’assied pas bien avec tous ceux qui utilisent ces systèmes. Mais après avoir acheté le design de nail art mentionné ci-dessus, j’étais curieux de savoir ce qu’il fallait pour faire une bonne invite d’IA commerciale – et combien d’argent il y avait réellement. PromptBase m’a mis en contact avec le designer, Justin Reckling, pour en parler.

Ce qui suit a été condensé et légèrement modifié pour plus de clarté.

Comment et quand êtes-vous entré dans l’ingénierie rapide ? Aviez-vous des compétences particulières qui vous ont rendu bon ?

Je suis entré dans l’ingénierie rapide en avril 2022 lorsque j’ai pu mettre la main sur l’outil de génération de texte GPT-3 d’OpenAI. J’ai rapidement découvert que j’avais un talent pour cela et que j’étais capable de créer de superbes invites de texte à image avec. Mes compétences connexes comprennent la programmation et l’assurance qualité des logiciels. De plus, j’ai un bon sens de l’esthétique, ce qui m’aide à créer des invites visuellement attrayantes.

Venez-vous à l’écriture rapide principalement du point de vue d’être un artiste, d’être un codeur ou un ingénieur, ou autre chose?

Je vois l’écriture rapide du point de vue d’un artiste, d’un codeur et d’un ingénieur. J’utilise mon expérience en programmation pour m’aider à comprendre comment le service peut interpréter mon invite, ce qui me guide vers un bricolage plus efficace pour amadouer les résultats que je recherche. Chaque mot d’une invite a un poids qui lui est associé, essayez donc de déterminer ce qui fonctionne le mieux et où devient un atout essentiel dans l’ensemble de compétences. Mon expérience en assurance qualité logicielle est un moteur assez important dans ce style de pensée « que se passe-t-il si ». Être trop verbeux en grandissant a également été une sorte de bénédiction déguisée. C’est très libérateur d’avoir cela comme un atout maintenant.

Résultats de l'invite

Résultats de l’invite « Infirmière pin-up art » de DALL-E
PromptBase

Combien d’invites vendez-vous dans une journée/semaine typique ? Avez-vous une idée de la raison pour laquelle les gens les achètent ?

Je vends généralement entre trois et cinq invites par jour, chaque invite réalisant en moyenne deux à trois ventes en un mois ou deux. J’ai actuellement un inventaire de 50 invites, avec de nouvelles ajoutées régulièrement. La majorité des invitations qui se sont vendues semblent être pour le plaisir plutôt que pour des raisons professionnelles.

Comment décidez-vous ce que vous allez fabriquer et vendre ? Est-ce davantage basé sur vos intérêts personnels ou sur une demande dans la communauté ?

C’est un mélange d’intérêts personnels et de demande de la communauté. Je veux faire des choses que les gens trouveront utiles et inspirantes, et c’est super quand ces deux choses se chevauchent. Je dois également garder un œil sur ce qui se vend bien afin de comprendre les besoins de la communauté et de continuer à fournir ce qu’elle recherche. J’utilise la liste de carrousel des « invites les plus populaires » sur la page principale. Nous mettrons bientôt la main sur des mesures spécifiques au vendeur.

Quelle est votre invite la plus populaire ?

Bloquer les villes a le plus de ventes. Mes vues les plus élevées par rapport à l’invite d’achats devraient être mes Photos de produits de t-shirts.

Comment commencez-vous à construire une invite ?

Une fois que j’ai une idée approximative de ce que je veux accomplir, j’essaie de réduire les choses aux personnes, aux lieux et aux choses – les acteurs principaux ou les principaux moteurs de la scène que j’essaie de construire. J’utilise le service pour générer quelques invites approximatives afin d’avoir une idée de ce à quoi la scène pourrait ressembler. Je trouve qu’il est beaucoup plus facile de prendre quelque chose qui fonctionne bien et de l’ajouter plutôt que d’avoir à revenir en arrière et à supprimer des choses jusqu’à ce que cela ait l’air mieux. Vous commencez par les grands traits importants, puis vous travaillez dans les détails les plus fins.

Combien de recherches faites-vous sur ce que vous essayez de générer ? Si vous faites du nail art, par exemple, devez-vous apprendre des choses comme la terminologie des ongles et les poses de main préférées, ou allez-vous par intuition ?

Je fais pas mal de recherches pour chaque invite de texte à image que je crée. Je commence par poser des questions sur le sujet GPT-3 pour m’aider à mieux comprendre la scène que j’essaie de créer. Par exemple, si je crée une invite à propos de quelqu’un qui se fait manucurer, je pourrais demander : « Quelqu’un se fait faire une manucure ; expliquez ce que vous voyez. Cela me permet d’obtenir des détails plus précis d’un expert plutôt que d’avoir à me fier à des articles ou à d’autres sources d’information qui pourraient ne pas être aussi précises.

Y a-t-il des compétences ou des astuces particulières que vous avez apprises au cours de votre travail et qui facilitent l’incitation ?

Lors de la création d’invites de texte à image, il peut être utile d’utiliser des citations pour séparer les idées principales. En outre, il peut être utile de se familiariser avec des termes tels que « hyper-réaliste », « macrophotographie », « rendu octane », « hyper-détaillé », « éclairage cinématographique », « plan long », « plan moyen », etc. Cela vous permettra de mieux comprendre comment ajouter de la profondeur et des détails à vos invites et vous aidera également à contrôler la distance et la mise au point. Par exemple, vous pouvez ajouter les phrases « éclairage cinématographique » et « heure dorée » à la fin de l’invite ci-dessus pour créer une image plus raffinée et spécifique.

Invite

Invite « Bloquer les villes » pour DALL-E.
PromptBase

Votre travail visuel semble principalement basé sur DALL-E, mais en quoi le processus de construction rapide est-il différent pour d’autres systèmes comme Midjourney ?

Cela dépend vraiment de ce que vous recherchez et de ce que vous avez besoin que l’invite fasse. Si vous voulez quelque chose de plus soigné et professionnel, comme une substitution d’image de stock, alors DALL-E est probablement votre meilleur pari. Cependant, si vous recherchez quelque chose de plus créatif et pratique, alors Midjourney pourrait être une meilleure option. Avec Midjourney, vous pouvez ajuster le poids des mots, décider de la résolution souhaitée et effectuer d’autres personnalisations. Mais gardez à l’esprit qu’il faut plus de temps et d’efforts pour obtenir les résultats souhaités.

Que fait l’ajustement du poids des mots ?

Augmenter le poids augmente la force de la « saveur » de ce mot, il y a donc plus de chances qu’il se manifeste de manière plus visible. Inversement, vous pouvez réduire les poids aussi bien que nécessaire. Pour ce faire, ajoutez deux deux-points et un nombre. Chaque mot a un poids de 1, « hot dog :: 1,5 » augmente le poids du chien de 1,5 fois, où 0,5 le réduirait de moitié.

Donc, réduire le poids du « chien » rendrait plus probable que vous obteniez la nourriture au lieu d’un vrai chien ?

C’est exact, et l’augmenter peut vous donner un chien très attirant ou qui pourrait chercher à boire de l’eau.

En passant, j’aime beaucoup Midjourney. J’imagine que plus de mes invites seraient basées sur Midjourney, mais jusqu’à récemment, seules les invites DALL-E étaient acceptées par PromptBase, c’est donc là que j’ai dépensé la plupart de mes efforts.

Il convient également de noter qu’il existe un générateur de texte en image appelé Stable Diffusion que vous pouvez exécuter localement sur votre ordinateur. Cependant, vous avez besoin d’une carte vidéo assez puissante pour exécuter le modèle, il n’est donc pas aussi largement accessible qu’il pourrait l’être. Je pense qu’à long terme, les modèles gérés localement et exempts de restrictions finiront par dépasser les grands acteurs du marché. J’ai beaucoup expérimenté ces derniers temps.

La possibilité de bricoler vos invites sans avoir à dépenser beaucoup d’argent est un gros avantage pour moi. À l’heure actuelle, je dois dépenser 10 $ à 15 $ en crédits pour chaque invite que je crée pour obtenir les résultats souhaités.

En comparant cela avec les chiffres précédents, il semble que vous dépensiez plus pour chaque invite que vous ne gagniez en ventes.

Oui, j’ai besoin de vendre environ 5 à 10 d’une invite donnée pour atteindre le seuil de rentabilité. Certains d’entre eux ne prennent pas longtemps à générer, et à mesure que je m’améliore dans la recherche de texte à réutiliser entre les invites, j’aurai besoin de moins de variations pour atteindre mon objectif final. Investir dans cette technologie vaut la peine à long terme, car l’intérêt ne cesse de croître pour ses cas d’utilisation. J’acquiers également des compétences que je peux appliquer à d’autres modèles, donc je ne pense pas que ce soit vraiment un inconvénient pour le moment.

Cela éclaire également la valeur des invites. Il y a beaucoup de gens qui critiquent ce que je fais, mais la plupart du temps, ils ne voient que le résultat final et aucun des efforts nécessaires pour arriver à cette destination finale. C’est une question de recul pour eux. Bien sûr, n’importe qui peut taper ces mots, mais pouvez-vous comprendre comment obtenir des mains manucurées dans une pose cohérente dès la première invite ? La cohérence des résultats exceptionnels des invites est également une grande source de valeur.

Même si le coût monétaire de cette découverte chute, un certain temps et des efforts ont été consacrés aux derniers mots de cette invite, qui auront toujours de la valeur.

Une invite DALL-E pour les photos de produits de t-shirts.

Une invite DALL-E pour les photos de produits de t-shirts.
PromptBase

Que pensez-vous de la propriété de votre travail ? Savez-vous si vos invites sont protégées par le droit d’auteur et dans quelle mesure cela vous importe-t-il ?

Je ne pense pas trop à la propriété de mon travail – j’essaie simplement de créer quelque chose dont je suis fier et que les autres apprécieront. En ce qui concerne la protection des droits d’auteur, je ne m’en soucie pas trop puisque je suis payé pour révéler mon travail. Je pense que notre société devrait fournir des filets de sécurité sociale, comme le revenu de base universel, pour aider ceux qui, dans le domaine de la création, pourraient avoir des difficultés financières. Cela deviendra de plus en plus important à mesure que l’automatisation continue d’affecter différentes professions.

J’ai vu que vous aviez également fait des invites textuelles GPT-3. Pouvez-vous écrire une invite de texte AI qui générerait automatiquement des invites d’art AI?

J’ai un modèle formé chez OpenAI que je viens de recevoir l’autorisation de partager et qui est disponible sur typestitch.com. Il a été formé sur un certain nombre de données provenant d’invites du monde réel, il peut donc prendre un ou deux mots-clés et générer des exemples d’invites que vous pouvez essayer pour vous amuser ou simplement pour vous donner des idées de concept à manipuler.

J’utilise le modèle tous les jours pour m’aider à faire couler le jus créatif ou, à la fin de la journée, pour trouver une folie aléatoire à partager avec des amis. Cependant, je n’ai jamais été au point de vendre une invite qui a été générée telle quelle. Les besoins du public sont encore beaucoup trop nuancés pour générer de manière fiable une invite favorable dès le départ. Mais avec suffisamment d’exemples, un modèle peut vous donner beaucoup d’idées nouvelles et étranges avec lesquelles vous amuser.

source site-132

- Advertisement -

Latest