dimanche, décembre 29, 2024

AssemblyAI obtient 50 millions de dollars pour créer et servir des modèles vocaux d’IA

Les entreprises misent gros sur l’IA générative pour obtenir un avantage concurrentiel. Mais les défis d’adoption demeurent. Selon une enquête récente d’EY, une partie importante des entreprises cherchant à adopter l’IA générative affirment que les progrès rapides dans ce domaine – et l’augmentation du nombre de fournisseurs prétendant posséder une expertise en IA – compliquent leurs perspectives de déploiement.

Cependant, vous ne le sauriez pas grâce à leurs dépenses. Selon les prévisions d’IDC, les investissements mondiaux dans les systèmes « centrés sur l’IA » pourraient atteindre 154 milliards de dollars d’ici la fin de l’année. Et un sondage du MIT Tech Review a révélé que 50 % des entreprises prévoient d’augmenter de plus de 25 % leurs budgets consacrés à l’infrastructure de données et à l’IA au cours de l’année à venir.

Le boom profite à des startups comme AssemblyAI (que TechCrunch a couvert trois fois auparavant), une entreprise autoproclamée « d’IA appliquée » qui recherche, forme et déploie des modèles d’IA que les développeurs et les équipes de produits peuvent intégrer dans leurs applications et services.

AssemblyAI affirme que sa base de clients payants a augmenté de 200 % par rapport à l’année dernière pour atteindre 4 000 marques et que sa plate-forme d’IA gère désormais environ 25 millions d’appels API par jour. De plus, selon AssemblyAI, plus de 200 000 développeurs s’appuient sur la plate-forme, l’utilisant pour traiter plus de 10 téraoctets de données par jour.

« Les modèles d’IA s’améliorent et évoluent rapidement », a déclaré Dylan Fox, co-fondateur et PDG d’AssemblyAI, à TechCrunch dans une interview par courrier électronique. « Les entreprises qui exploitent la plateforme API d’AssemblyAI peuvent se concentrer sur la création de nouveaux produits, applications et flux de travail d’IA sans avoir à se concentrer sur le développement de modèles, la formation et le rythme rapide de l’innovation des modèles. Ils n’ont pas non plus à se soucier du déploiement eux-mêmes de modèles d’IA à grande échelle, ce qui est extrêmement difficile à réaliser à faible coût et avec une haute disponibilité.

La plateforme de développement AssemblyAI.

Le succès d’AssemblyAI a attiré l’attention d’investisseurs de renom, dont certains ont récemment contribué à une nouvelle tranche de financement pour la startup. Accel a mené une levée de fonds de 50 millions de dollars dans AssemblyAI, annoncée aujourd’hui, avec la participation de l’ancien co-PDG de Salesforce Keith Block, de l’ancien PDG de GitHub Nat Friedman et Daniel Gross, Insight Partners et Y Combinator. Le capital total levé d’AssemblyAI s’élève désormais à 115 millions de dollars.

Fox, ingénieur en apprentissage automatique de formation, a fondé AssemblyAI fin 2017. Il dit avoir été inspiré par Amazon Echo, qui, selon Fox, est l’un des premiers grands exemples de produits rendus possibles par de meilleurs systèmes d’IA pour la voix.

« Alors que j’ai commencé à explorer la création de mes propres produits avec différents modèles d’IA vocale disponibles à l’époque, j’ai été déçu que la plupart des entreprises proposent encore des modèles d’IA vocale hérités et inexacts via des produits de développement difficiles à utiliser », a déclaré Fox. « Cela m’a motivé à démarrer AssemblyAI – avec la vision de créer des modèles d’IA surhumains, disponibles via une plate-forme de développement facile à utiliser, qui débloqueraient des classes entièrement nouvelles d’applications d’IA à créer. »

Aujourd’hui, AssemblyAI propose des modèles d’IA, en particulier des modèles axés sur la parole, conçus pour effectuer des tâches telles que la synthèse vocale, l’identification des locuteurs, la modération du contenu et la synthèse de la parole via une API. Des clients comme Fireflies, une application de transcription de réunions, diffusent du contenu allant des appels téléphoniques et des réunions Zoom aux podcasts et vidéos via les modèles, explique Fox.

Désormais, les modèles vocaux ouverts et propriétaires ne manquent pas, provenant de startups rivales telles que Deepgram, Rev et Speechmatics, ainsi que de géants de la technologie comme Google Cloud, Azure et AWS. Mais Fox fait valoir – à tort ou à raison – que les modèles d’AssemblyAI sont plus « avancés », « précis », « capables » et « riches en fonctionnalités » que ceux de la concurrence.

« Les grandes sociétés de cloud computing proposent des offres de produits similaires… mais elles sont rarement mises à jour, moins précises, comportent beaucoup moins de fonctionnalités et sont beaucoup plus difficiles à intégrer », a-t-il poursuivi.

AssemblyAI ne se repose pas sur ses lauriers, cela dit. Une partie du nouveau financement sera consacrée à un modèle vocal « universel » sur lequel la société s’entraîne sur un pétaoctet de données vocales, et dont le lancement est prévu plus tard cette année », a déclaré Fox. AssemblyAI augmente également ses effectifs, dans le but d’augmenter son effectif de 115 personnes de 50 à 75 % l’année prochaine.

« Nous travaillons à la création du ‘Stripe for AI models’ – où les développeurs et les équipes produit pourront accéder facilement à l’IA de pointe via une simple API », a déclaré Fox. « En fournissant ces éléments aux clients, ils peuvent se concentrer sur la création d’applications plus verticales et de flux de travail internes qui exploitent nos données exclusives et les modèles d’IA vocale en constante amélioration d’AssemblyAI… Nous avons des années de piste grâce au nouveau cycle de financement et constatons un incroyable quantité de demande et d’adoption de produits compte tenu de la poussée dominante autour de l’IA.

Source-146

- Advertisement -

Latest