À l’heure actuelle, tous les secteurs sont confrontés à des discussions sur la manière dont l’intelligence artificielle pourrait aider ou entraver le travail. Dans les films, les créateurs craignent que leur travail ne soit volé pour former des remplaçants en IA, que leurs futurs emplois soient occupés par des machines, ou même que l’ensemble du processus de réalisation d’un film puisse devenir entièrement automatisé, supprimant ainsi tout besoin, des réalisateurs aux acteurs en passant par tout le monde. Dans les coulisses.
Mais « l’IA » est bien plus compliquée que ChatGPT et Sora, les types d’outils accessibles au public qui apparaissent sur les réseaux sociaux. Pour les artistes d’effets visuels, comme ceux de Wētā FX qui ont travaillé sur Royaume de la planète des singesl’apprentissage automatique peut n’être qu’un autre outil puissant dans un arsenal artistique, utilisé pour créer des films plus grands et plus beaux qu’auparavant. Royaume Le superviseur des effets visuels Erik Winquist s’est entretenu avec Polygon avant la sortie du film et a discuté de la manière dont les outils d’IA étaient essentiels à la réalisation du film et de la manière dont les limitations de ces outils rendent toujours l’élément humain clé du processus.
Pour la confection de Royaume de la planète des singesWinquist affirme que certains des outils d’apprentissage automatique les plus importants étaient appelés « solveurs ».
« Un solveur, essentiellement, se contente de prendre un tas de données, qu’il s’agisse des points sur le visage d’un acteur. [or] sur leur combinaison mocap – et en exécutant un algorithme », explique Winquist. « [It’s] essayer de trouver le moins d’erreurs, essentiellement en essayant de faire correspondre l’endroit où se trouvent ces points dans l’espace 3D, avec une articulation sur le corps de l’acteur, le corps de sa marionnette, disons. Ou, dans le cas d’une simulation, un solveur prend essentiellement l’endroit où chaque point – dans la simulation d’eau, par exemple – se trouvait dans l’image précédente, regarde sa vitesse et dit : « Oh, donc il devrait être ici ». [in the next frame] » et appliquer la physique à chaque étape du processus. «
Pour les visages de RoyaumeParmi les nombreux personnages de singes, Winquist dit que les solveurs pourraient manipuler des modèles de singes numériques pour correspondre approximativement aux formes de bouche et à la synchronisation labiale des acteurs, donnant aux visages les vagues plis et rides que l’on pourrait s’attendre à former avec chaque mot. (Winquist dit que Wētā a initialement développé cette technologie pour cartographier la performance de Thanos de Josh Brolin sur un modèle numérique dans les films Avengers.) Une fois qu’un solveur a opéré sa magie, les artistes de Wētā se mettent au travail sur la partie la plus difficile : prendre les images que le solveur a commencées, et les polir pour qu’ils soient parfaits. C’est, pour Winquist, qu’intervient le véritable talent artistique.
« Cela signifiait que nos animateurs faciaux pouvaient l’utiliser essentiellement comme un tremplin ou comme un trampoline », explique Winquist en riant. « Donc [they can] passent leur temps à vraiment peaufiner et à rechercher les endroits où le solveur faisait quelque chose sur un visage de singe qui ne traduisait pas vraiment ce que faisait l’acteur.
Au lieu de devoir créer minutieusement chaque synchronisation labiale et chaque tic facial, les artistes concentrent leur temps sur la création des profondeurs de nuances émotionnelles que le solutionneur ne pouvait pas gérer. Cela leur permet d’effectuer un travail plus minutieux et plus détaillé que ce qui aurait été possible lorsque ces premières étapes devaient être réalisées à la main.
Alors que la plupart des outils d’IA qui ont suscité des inquiétudes en ligne sont formés en extrayant des milliers d’œuvres d’art publiées sur Internet par des artistes qui n’ont pas donné leur autorisation pour cette utilisation – et en intégrant leurs styles et éléments afin de construire son vocabulaire – Les outils de Wētā sont formés en interne, uniquement sur le propre travail du studio, selon Winquist.
« Il y a tellement de zones grises autour de la propriété des droits d’auteur, et on se demande : « D’où récupèrent-ils toutes ces informations ?‘ Droite? » dit Winquist. « Là où nous utilisons l’apprentissage automatique dans notre pipeline, l’algorithme est essentiellement formé sur nos informations. Il est formé sur nos acteurs, il est formé sur les images que nous lui alimentons, que nous avons générées. Pas des images de n’importe où.
Les outils de résolution, que Winquist et son équipe ont construits et affinés sur chaque film sur lequel Wētā a travaillé, permettent au studio d’entreprendre des projets et des scènes plus ambitieux que ce qu’ils auraient pu faire dans le passé. Par exemple, la pièce maîtresse massive au point culminant de Royaume de la planète des singes C’est une scène que Winquist n’est pas sûr d’avoir pu réaliser sans la dernière génération de logiciels de résolution d’eau de l’équipe. Sans surprise, ces outils ont été affinés au cours de la production sur Avatar : La Voie de l’Eau. Winquist note que le travail représentait une avancée par rapport aux scènes d’eau de Guerre pour la planète des singesle film précédent de la franchise.
«Nous aurions eu du mal», dit Winquist. « Je dirais que si nous n’avions pas réalisé ces films précédents, il y aurait eu un gros effort de R&D pour nous mettre à la hauteur. »
Winquist poursuit en décrivant les incroyables complications de Royaume de la planète des singes‘ diverses scènes d’eau : l’une se déroule sur un pont au-dessus d’une rivière en furie, et une autre implique une crue massive de l’eau de l’océan. Selon Winquist, Voie de l’eauLe solveur d’eau de a été essentiel pour faire décoller ces scènes, car il a permis aux artistes d’effets de simuler la façon dont l’eau réagirait à certains éléments, comme les personnages singes et leurs corps poilus, sans restituer complètement ces scènes dans un ordinateur.
Cela a permis aux directeurs artistiques de peaufiner la scène avant le rendu, rendant ainsi possibles des ajustements rapides. Auparavant, les ordinateurs pouvaient avoir besoin de près de trois jours pour restituer entièrement tous les détails CG d’une scène avant que l’équipe des effets puisse observer les résultats, peaufiner les algorithmes, puis recommencer le processus. Cela rendait ce type de scène CG pratiquement impossible à affiner comme l’équipe de Wētā l’a pu avec ce film.
Mais malgré toutes les façons dont la technologie de l’IA s’est révélée essentielle RoyaumeWinquist ne le voit toujours que comme un outil vide sans les artistes qui le guident et cernent le produit fini.
«Je ne veux pas éclipser l’élément humain», déclare Winquist. « J’ai vu des approches dans lesquelles l’établissement a vraiment approfondi l’aspect apprentissage automatique, et j’ai l’impression que c’est là que tout s’est arrêté. Je vois le résultat de cela, et je ne crois tout simplement pas à cette voix qui sort de ce visage ou quoi que ce soit. Ce que je trouve avec lequel nous avons tant de succès, c’est que ce sont les artistes qui, en fin de compte, conduisent [the finished scenes]en utilisant les éléments d’apprentissage automatique comme un outil, au lieu de la réponse au problème.
Pour Winquist, cet élément humain sera toujours la clé pour produire quelque chose de grand et d’intéressant sur le plan artistique.
« Finalement, [machine-learning tools] ne peuvent que régurgiter ce qu’ils ont mangé », dit-il. « Je ne sais pas. Peut-être que je suis un Luddite, mais je ne sais tout simplement pas s’il y a un moment où ces trucs peuvent avoir un impact significatif sur [a movie] vraiment engageant – une œuvre d’art que quelqu’un voudra réellement s’asseoir et regarder. La chose à laquelle je reviens toujours, c’est Pourquoi devrais-je prendre la peine de lire quelque chose que quelqu’un n’aurait pas pris la peine d’écrire ? Que ce soit des mots ou des images.
Royaume de la planète des singes fait ses débuts en salles le 10 mai.