mercredi, décembre 25, 2024

Cette application d’art alimentée par l’IA vous permet de peindre des images avec des mots

Les pouvoirs de maîtrise de la réalité de l’IA ont été de plus en plus occupés au cours de la dernière décennie. Nous avons eu des dioramas 3D basés sur la vision par ordinateur ; transfert de style avant-gardiste ; réglage de selfie photoréaliste viral, retouche de selfie, échange de visage et – ofc – deepfakes ; et beaucoup de frivoles (et hilarant) amusant avec des filtres selfie (objectif de dessin animé ohhai « Disneyfying » !) Entre les deux.

Le remix visuel alimenté par l’IA a montré, encore et encore, qu’il peut attirer l’attention. Bien que garder « les yeux sur » une fois que la nouveauté d’un effet généré par l’IA s’estompe peut être plus difficile. (Les applications de retouche selfie n’ont pas ce problème, attention ; il y a une demande perpétuelle pour l’apprentissage automatique en tant que réalité rehausseur.)

Ce qui est le plus remarquable dans les développements des médias synthétiques compatibles avec l’IA au cours de cette période, c’est la vitesse à laquelle ces effets visuels ont augmenté, aidés par un matériel de traitement mobile toujours plus puissant.

Les temps d’attente pour un résultat fini peuvent désormais être essentiellement instantanés, ce qui change la donne pour produire (et potentiellement monétiser) la créativité et la puissance des réseaux de neurones et des GAN (Generative Adversarial Networks). Aka, le frameworks d’apprentissage automatique effectuant la retouche, le recadrage ou même la modélisation générative, sautant d’une invite humaine pour leur inspiration.

Et bien que la plupart des remix visuels basés sur les applications de la dernière décennie se soient concentrés sur la retouche/le restylage/l’augmentation par rapport à la génération d’images purement basée sur l’IA, cela aussi est en train de changer.

Wombo, une startup canadienne qui a attiré l’attention sur son application vidéo éponyme de synchronisation labiale compatible avec l’IA, a récemment lancé une autre application, appelée Dream (iOS et Android), qui utilise l’IA pour créer des « œuvres d’art » originales – basées sur une invite de texte.

C’est super, super simple : vous décrivez simplement ce que vous voulez qu’il peint — dites « Un arbre terrifiant » ou « Le pire sandwich de l’histoire » — choisissez un style parmi la sélection proposée (Mystique, Baroque, Fantasy Art, Steampunk, etc.), ou optez pour « pas de style » ; et appuyez sur créer.

Ensuite, littéralement en quelques secondes – j’ai compté <20 - l'application affiche votre "œuvre d'art" terminée.

Vous ne pouvez même pas vous ennuyer pendant ces quelques secondes de création, car vous avez un aperçu de l’IA à l’œuvre : , pour arriver, pratiquement essoufflé, à une autre composition finie.

Certaines de ces œuvres d’art générées semblent assez impressionnantes. Certains… pas tellement.

Mais bien sûr, deux invites ne génèrent pas la même image. Ainsi, vous pouvez continuer à demander une nouvelle image à partir de la même invite jusqu’à ce que vous aimiez l’apparence de ce que vous voyez.

En bref, les artistes de cartes de Noël et les illustrateurs de pulp fiction peuvent probablement prendre leur retraite maintenant.

Tout le monde est un « artiste » maintenant.

Cela dit, de vrais artistes devrait avoir moins à s’inquiéter. Notamment parce que l’art créé par un cerveau et un corps humains ne prendra de la valeur qu’une fois que le monde sera inondé d’« art mécanique ». (Tout comme chaque NFT frappé dilue le sens de l’expression « art numérique »… )

La qualité de « l’art » de l’application Dream est définitivement variable. Des invites plus longues et plus complexes semblent le confondre. Ainsi, la qualité de la sortie peut dépendre de ce que vous lui demandez de dessiner.

Tandis que son « style », s’il peut être considéré comme ayant un seul style global au milieu de tant de pastiche, tend davantage vers l’abstrait et la distorsion que vers le spécifique et précis. Ainsi, les demandes de portrait ne seront pas rendues photoréalistes. Et il est généralement plus confortable de décrire le fantastique que le réel. (Une invite «Vierge à l’enfant» a servi un travail plus proche d’un tristement célèbre échec de restauration d’église espagnole qu’un crypto-Botticelli, par exemple.)

Mais la vitesse de production est impressionnante. Slash terrifiant.

Dès qu’une nouvelle œuvre d’art apparaît, l’application ne perd pas de temps à essayer de la vendre – en affichant une option pour « acheter une impression », qui renvoie à sa boutique en ligne et ressemble à un moyen pratique de transformer une astuce visuelle en revenu réel. (Il propose « Custom Wombo Dream Print[s] » qui commencent à 20 $ pour une affiche mate ou à 45 $ pour une impression encadrée.)

Si la startup peut transformer environ 20 secondes de traitement en plus de 20 $ de revenus, cela pourrait constituer un bon petit pipeline d’argent.

À la fin du mois dernier plus de 10 millions d’images avaient déjà été générés par les utilisateurs. (Alors que l’application Google Play a déjà eu plus d’un million de téléchargements, un mois environ après le lancement.)

Bien que la plupart des gens disposent d’un espace mural limité sur lequel accrocher n’importe quel type d’art, sans parler des images générées par, euh, une machine insensée – donc la plupart de ces créations aléatoires resteront fermement virtuelles. (« L’art de l’IA » pourrait être un parfait fourrage NFT, cependant…)

Où « l’art de l’IA » tombera-t-il dans les enjeux de la mode et de la valeur culturelle est certainement une question intéressante à méditer.

C’est bien sûr supérieur aux images clipart ou aux photos d’archives. Et la sortie de l’application Dream peut également être plus intéressante que la moyenne des impressions « d’art » que vous pourriez acheter chez Ikea. Mais les résultats peuvent aussi être plutôt nauséabonds – ou dérivés – ou nuls – ou tout simplement étranges.

Et bien, est-ce de l’art ? Ou est-ce juste une sortie visuelle d’un processus mathématique ? Une abstraction de la compétence créative humaine qui ne peut pas traduire une émotion réelle ou un sentiment d’identité ou d’âme parce que le code n’a aucune de ces choses ? Il fait juste ce qu’on lui dit.

Et vous avez vraiment envie d’accrocher une abstraction codée sur vos murs ?

Je veux dire, peut-être ? Si c’est surtout esthétique. Mais bon, c’est de l’art ou juste du papier peint ? Peut-être que Wombo devrait vendre des rouleaux de papier peint Dream AI ou des tapis de souris et des t-shirts imprimés (merch), plutôt que des impressions « artistiques »…

Beaucoup à méditer.

Certaines choses sont claires : l’art généré par l’IA est incroyablement amusant à jouer. C’est une sorte d’herbe à chat visuelle. Un jouet pour l’imagination.

C’est aussi, sans aucun doute, là pour rester. Et les modèles d’IA continueront de s’améliorer – en fonction de ce que nous entendons par « meilleur » autour d’un sujet aussi subjectif que l’art. (Peut-être que les modèles d’art génératif donneront des résultats plus réussis en amenant l’utilisateur plus complètement dans le processus créatif – en lui donnant des outils pour personnaliser et manipuler les sorties de la machine afin qu’elles puissent être [fine]réglé jusqu’à ce qu’ils soient plus proches de ce que la personne imaginait, ou bien ressentir plus personnellement unique et significatif. Ou, en d’autres termes, un processus de création plus hybride peut produire des sorties artistiques plus puissantes et émouvantes.)

Il y aura également des dizaines de ces IA artistiques, chacune produisant différentes « saveurs » et « caractères » de sortie visuelle – dérivés de leurs données d’entraînement. Ou même – si vous aimez – des IA artistiques avec différents « styles ». (Mais peut-être que « spécialités » est plus proche de la marque codée.)

Il existe un certain nombre d’autres outils d’IA de génération d’images basés sur GAN – et j’avoue être Un grand fan du système de Pixray (les sorties pixel art sont particulièrement mignonnes) bien que ses vitesses de traitement soient beaucoup, beaucoup plus lentes – mais Wombo semble avoir été le plus rapide à appliquer et à monétiser cette technologie.

La prochaine décennie d’apprentissage automatique qui déforme la réalité sera tout un voyage.

Source-146

- Advertisement -

Latest