Sora, un nouvel outil d’IA d’OpenAI, promet de transformer la création vidéo en générant des clips photoréalistes à partir de simples instructions textuelles. Actuellement disponible pour les abonnés de ChatGPT Plus, Sora Turbo permet de créer des vidéos courtes et offre des fonctionnalités d’édition. Cependant, des défis techniques subsistent, notamment des problèmes de réalisme et des préoccupations éthiques concernant l’utilisation des images. OpenAI s’engage à établir des normes pour une utilisation responsable de cette technologie en pleine évolution.
Si OpenAI parvient à ses fins, Sora, un outil d’IA dévoilé en février, va révolutionner la création de vidéos grâce à sa capacité à produire des clips photoréalistes et de haute qualité à partir de simples instructions textuelles. Les professionnels de la vidéo et les cinéastes d’Hollywood seront parmi ceux qui ressentiront le plus l’impact de cette innovation dans leur domaine.
Essai de Sora Turbo pour les abonnés ChatGPT Plus
Actuellement, les créateurs de contenu, ainsi que toute personne disposant d’un abonnement mensuel de 20 $ à ChatGPT Plus, ont l’opportunité de tester Sora Turbo, qui a été mise à disposition aux États-Unis la semaine dernière, dans le cadre des annonces d’OpenAI. Il suffit de rédiger une invitation textuelle pour générer de courts clips, tout en ayant la possibilité d’importer des photos et d’autres vidéos comme matériel de référence. Les vidéos produites peuvent durer entre cinq et 20 secondes et sont disponibles en résolutions variant de 480 à 1 080 pixels, avec des formats adaptés en mode paysage, portrait ou carré. De plus, des options d’édition après génération, telles que le storyboard, le remix et la boucle, permettent d’affiner les créations, selon les commentaires de Katelyn Chedraoui.
Bien que les démonstrations de Sora aient été impressionnantes ces derniers mois — le Wall Street Journal ayant même noté que les vidéos d’IA ‘sont suffisamment bonnes pour provoquer la peur’ — OpenAI a admis qu’il restait des bugs à corriger. ‘Elle génère souvent des physiques irréalistes et a des difficultés avec des actions complexes sur de longues durées,’ a mentionné le blog de l’entreprise. Par exemple, on peut voir des personnages avec des membres en trop. OpenAI limite également l’accès aux testeurs pour la création de vidéos mettant en scène des humains, en vue de ‘répondre aux préoccupations concernant l’appropriation de l’image et les deepfakes.’
Progrès de Sora et enjeux de l’IA
Face aux préoccupations persistantes concernant les données d’entraînement utilisées pour alimenter les systèmes d’IA (certains éditeurs accusant OpenAI de s’approprier leur contenu protégé par des droits d’auteur), OpenAI a indiqué que Sora est formé sur un ‘mélange de données accessibles au public, de données propriétaires obtenues par le biais de partenariats, et de jeux de données personnalisés développés en interne,’ incluant des images fournies par des employés.
De plus, des rapports indiquent qu’OpenAI aurait pu intégrer du contenu de jeux vidéo non autorisé dans la formation de Sora. Malheureusement, l’entreprise n’a pas encore répondu concernant cette question. Les récents développements autour de Sora soulignent l’importance croissante des visuels générés par l’IA, avec des géants comme Google et Meta lançant également leurs propres outils pour engager davantage les utilisateurs. La semaine dernière, xAI d’Elon Musk a annoncé un éditeur d’images photoréalistes, nommé Aurora, pour son chatbot Grok, Musk ayant présenté Aurora comme un moyen de ‘créer des mèmes incroyables rapidement.’
OpenAI a également reconnu la nécessité d’établir des garde-fous autour de l’utilisation de ces outils potentiellement capables de générer des deepfakes. L’entreprise espère que d’autres acteurs du secteur contribueront à résoudre ces problématiques. ‘Nous lançons cette technologie de génération vidéo maintenant pour permettre à la société d’explorer ses applications et de co-développer des normes qui garantissent une utilisation responsable à mesure que le domaine évolue,’ a déclaré OpenAI.
Voici d’autres nouvelles passionnantes en matière d’IA qui méritent votre attention.
Google et l’avenir des agents IA
En mai, le PDG de Google, Sundar Pichai, a présenté un ensemble d’outils d’IA, affirmant que l’objectif de l’entreprise était de permettre à sa technologie de penser pour vous — notamment à travers des fonctionnalités comme les Aperçus IA, qui réalisent des recherches en votre nom.
La semaine dernière, Google a continué de concrétiser cette vision avec le lancement d’une nouvelle version de son chatbot Gemini et d’un prototype appelé Project Mariner, présenté dans un blog intitulé ‘Notre nouveau modèle d’IA pour l’ère agentique.’
Qu’est-ce que cela implique ? ‘Nous avons investi dans le développement de modèles plus agents, capables de mieux comprendre leur environnement, de penser plusieurs étapes à l’avance et d’agir sous votre supervision,’ a expliqué Pichai. Cela pourrait signifier que ces agents IA effectueront des recherches pour vous, trouveront les meilleures offres, planifieront des réunions, interagiront avec des tableurs pour donner des réponses à des questions complexes, et même joueront à des jeux. Cette nouvelle génération de technologie IA ‘nous rapprochera de notre vision d’un assistant universel,’ a-t-il ajouté.
Mariner, développé comme une extension pour le navigateur Chrome, est conçu pour fonctionner avec ‘des humains dans la boucle.’ Ainsi, bien qu’il puisse remplir votre panier d’achats en ligne, vous devrez toujours confirmer l’achat en appuyant sur le bouton d’achat.
Finalement, la prochaine génération d’agents IA de Google, tout comme celles proposées par OpenAI et Anthropic, semble destinée à nous amener vers un futur où l’IA effectuera de plus en plus de tâches à notre place.
Aperçu de l’IA aujourd’hui et à venir
Si vous pensez que 2024 sera l’année des débats autour des défis, des innovations et des produits liés à l’IA, attendez de voir comment cela continuera de dominer les discussions en 2025.
De plus en plus de personnes commencent à utiliser des chatbots, et le chatbot ChatGPT, qui figure parmi les leaders du marché, continue d’attirer l’attention.