La capacité de l’IA à réinventer la recherche sur le Web reste trouble, mais l’impact de la technologie sur les outils quotidiens semble plus prometteur. Exemple : Une startup appelée Capsule utilise l’IA dans un logiciel de montage vidéo pour améliorer la vitesse et l’efficacité des montages de post-production. Après avoir lancé son éditeur alimenté par l’IA en version bêta, la société a conclu un financement de démarrage de 4,75 millions de dollars pour commercialiser le produit.
À plus long terme, Capsule affirme qu’une telle technologie pourrait permettre à n’importe qui d’être créatif avec la vidéo, même s’il ne s’agit pas d’éditeurs vidéo professionnels.
L’entreprise n’a pas toujours été dans la technologie de l’IA. Fondée en 2020, Capsule est issue de la même équipe qui a construit l’outil de capture GIF animé et le réseau social Phhhoto, qui a finalement perdu face au clone d’Instagram, Boomerang. Après avoir fermé leur application en 2017, ils sont passés à une entreprise de marketing expérientiel pour les événements en direct appelée Hypno. Mais ils ont rapidement dû pivoter lorsque la pandémie de COVID-19 a mis fin au besoin des cabines photo en personne d’Hypno et d’autres expériences interactives.
Cela a conduit à la création de Capsule, une plate-forme qui a commencé comme un moyen pour les marques d’atteindre leurs communautés dans l’ère post-COVID en utilisant des questions-réponses en ligne et des histoires vidéo. En 2021, la société a levé 2 millions de dollars en financement de pré-amorçage pour sa plate-forme vidéo collaborative auprès d’Array Ventures, de Bloomberg Beta et de divers anges.
L’entreprise n’essaie pas nécessairement d’utiliser l’IA pour prendre en charge le travail des monteurs vidéo. Il indique que 90 % de ses revenus proviennent de l’entreprise, mais, plus précisément, d’un marché mal desservi d’équipes d’entreprise sans expertise vidéo qui ont encore besoin de cohérence dans l’image de marque. Sa plate-forme vidéo a été utilisée dans des entreprises comme Snowflake, TED, Salesforce et The Wall Street Journal, entre autres.
Plus récemment, Capsule a commencé à explorer comment de nouveaux modèles d’IA pourraient améliorer son produit.
Citant des données de HubSpot, la société souligne que la vidéo courte devrait croître plus rapidement que tout autre format en 2023, et plus de 90 % des spécialistes du marketing ont déclaré qu’ils prévoyaient de maintenir ou d’augmenter leur investissement dans la création vidéo. Mais la demande de vidéo dépasse l’offre d’éditeurs vidéo professionnels, a noté le co-fondateur et PDG de Capsule, Champ Bennett.
« Malgré le grand nombre d’outils vidéo sur le marché, les besoins des équipes d’entreprise ont été largement ignorés », a-t-il déclaré dans l’annonce de financement de la société. « Demandez à n’importe qui dans le marketing, les communications, les ventes ou le succès et ils vous diront que la vidéo surpasse tous les autres formats, mais ils vous diront également qu’ils ne l’utilisent pas assez souvent en raison du coût et de la complexité de son utilisation. faire. »
Pour relever ces défis, Capsule a créé AI Studio, qui se concentre sur les montages vidéo de post-production basés sur l’IA.
L’entreprise a présenté un démo de la technologie en décembre (voir ci-dessous), qui utilise l’IA et l’apprentissage automatique dans une variété de modèles, y compris un modèle ASR (reconnaissance automatique de la parole) pour transcrire l’audio de la vidéo en texte.
Il propose également un modèle de diffusion pour générer des images B-roll à partir de la transcription ainsi qu’un LLM génératif (grand modèle de langage) qui résume le texte de la transcription.
Le logiciel AI Studio s’exécute dans le navigateur, sans nécessiter d’application ou d’extension pour fonctionner, indique la société.
Après avoir téléchargé une vidéo sur la plate-forme, Capsule crée la transcription, qui est placée sur le côté de la vidéo pour être utilisée dans les modifications. Dans la démo, la société a montré comment un utilisateur pouvait sélectionner un bloc de texte, puis cliquer sur un bouton pour que le texte soit automatiquement résumé et transformé en une carte de titre, en utilisant l’IA et son langage de balisage vidéo. Il existe différents styles de carte disponibles, y compris une page de carte de titre animée et une carte de titre qui apparaît sous la vidéo, chacune pouvant être sélectionnée en un clic.
Il a également montré comment vous pouvez sélectionner un bloc de texte, puis demander à l’IA de générer automatiquement une image en fonction du sujet identifié dans le texte en surbrillance. De plus, vous pouvez cliquer dans le champ d’invite de texte et ajuster le texte pour un contrôle plus précis sur les résultats finaux.
Une autre fonctionnalité vous permet de sélectionner une ligne de texte pour la faire apparaître comme l’un des nombreux styles de légende disponibles, comme le texte plein écran, les légendes animées ou même une légende de style tweet.
« Ce que nous faisons pour la vidéo est similaire à ce que font des entreprises comme Jasper pour la rédaction ou que Replit fait pour le codage », a déclaré Bennett à TechCrunch. « Nous ne possédons pas les modèles. Au lieu de cela, nous exploitons les meilleurs modèles fondamentaux pour rendre les créateurs de vidéos 10 à 100 fois plus productifs, tout en abaissant simultanément la barrière à l’entrée afin que les équipes de marketing, de vente, de réussite et de leadership puissent créer par elles-mêmes des vidéos convaincantes sur la marque.
Les montages eux-mêmes sont alimentés par le langage de script vidéo de Capsule, CapsuleScript, construit au cours des deux dernières années et conçu pour fonctionner dans le navigateur. Toutes les sorties du modèle AI sont introduites en tant qu’entrées dans CapsuleScript.
« Pensez ce que HTML/CSS sont aux sites Web, CapsuleScript est à la vidéo. Il peut restituer la vidéo de manière dynamique, à la fois au moment de la création et de l’exécution, ce qui permet pour la première fois de créer une vidéo personnalisée à grande échelle », déclare Bennett. Mais il précise que les clients de Capsule ne recherchent pas une solution « en un clic » entièrement automatisée, même si CapsuleScript en serait capable.
« En réalité, ce que les clients veulent réellement, c’est 80 % d’automatisation et 20 % de personnalisation afin qu’ils puissent raconter une histoire unique et créative sans une tonne de frictions », explique-t-il.
Après la publication de la démo, la société a dû mettre l’accès à AI Studio derrière une liste d’attente en raison de la demande, a déclaré la société.
Grâce à ce financement supplémentaire, Capsule indique qu’elle vise à embaucher des équipes clés dans les domaines de l’ingénierie, de la conception de produits et du marketing pour l’aider à commercialiser plus rapidement son produit AI Studio. Il cherche à ajouter une douzaine d’employés à temps plein, dont un ingénieur ML, un ingénieur front-end, un responsable de la vidéo et du marketing et un concepteur de produits.
Les investisseurs qui soutiennent la société dans le nouveau tour de table qui s’est terminé fin janvier comprennent Human Ventures, Swift Ventures, Tiferes Ventures du fondateur d’InVision, Clark Valberg, Behind Genius Ventures, ainsi que ses investisseurs de pré-amorçage Array Ventures et Bloomberg Beta.
Les investisseurs providentiels incluent le PDG de Replit Amjad Masad, le directeur technique de Dropbox Arash Ferdowsi, le directeur des ventes de Figma Kyle Parrish, l’ancien directeur de l’audio et de la vidéo chez le fondateur de Spotify / Anchor Mike Mignano, le co-fondateur de Chorus.ai Roy Ranani et le fondateur de Gumroad Sahil Lavingia.
La société a refusé de partager ses mesures liées aux revenus ou au nombre total de clients, mais a déclaré qu’elle prévoyait d’annoncer ces dernières « bientôt ».
En incluant le nouveau financement, la startup basée à New York a levé 6,75 millions de dollars depuis sa fondation.