Replicate veut simplifier l’exécution et l’hébergement de modèles ML

Replicate, une startup qui exécute des modèles d’apprentissage automatique dans le cloud, a été lancée aujourd’hui de manière furtive avec 17,8 millions de dollars en capital-risque ; 12,5 millions de dollars du total provenaient d’une série A dirigée par Andreessen Horowitz avec la participation de Y Combinator, Sequoia et d’investisseurs providentiels, dont le PDG de Figma Dylan Field et Guillermo Rauch de Vercel, tandis que le reste provenait d’un tour de table non divulgué auparavant.

La société a été cofondée par Ben Firshman, qui a dirigé les efforts sur les produits open source chez Docker, et Andreas Jansson, auparavant ingénieur en apprentissage automatique chez Spotify. D’après Firshman, lui et Jansson se sont rendus compte que l’IA s’accélérait à un rythme « absurde », mais que des barrières techniques s’opposaient à son adoption massive.

Entrez Replicate, qui propose une bibliothèque de modèles open source que les développeurs de logiciels peuvent exécuter avec quelques lignes de code. La plate-forme peut générer automatiquement un serveur d’API pour des modèles d’apprentissage automatique personnalisés, déployés sur un grand cluster de GPU.

« Si vous obtenez une tonne de trafic, nous nous adaptons pour gérer la demande. Si vous n’obtenez pas de trafic, nous réduisons à zéro et ne facturons rien », a expliqué Firshman. « Nous ne vous facturons que la durée d’exécution de votre code. L’alternative consiste généralement à déployer vous-même des modèles sur Amazon Web Services. En règle générale, vous devez vous battre avec des serveurs, Kubernetes, des GPU, des serveurs d’API, la mise à l’échelle automatique, etc. »

Core to Replicate est Cog, un outil open source qui permet aux développeurs de conditionner des modèles d’apprentissage automatique dans un format de conteneur standard prêt pour la production. Firshman et Jansson ont développé Cog, qui fonctionne sur n’importe quelle machine macOS, Linux ou Windows 11 plus récente.

« L’IA est actuellement trop difficile à utiliser pour les ingénieurs en logiciel et vous devez être un ingénieur en apprentissage automatique pour l’utiliser », a déclaré Firshman. « Les entreprises et l’industrie dans son ensemble sont freinées par le manque d’experts en apprentissage automatique. Nous permettons aux ingénieurs logiciels d’utiliser l’apprentissage automatique sans aucune expérience, avec seulement quelques lignes de code, afin qu’ils puissent créer des produits avec l’IA et l’appliquer aux problèmes de l’entreprise. »

Replicate héberge des milliers de modèles prêts à l’emploi, y compris des modèles texte-image et image-texte (à la Stable Diffusion). Crédits image : Reproduire

Replicate n’est pas le seul à le faire. La startup est en concurrence avec des fournisseurs tels que Hugging Face et OctoML (et dans une certaine mesure Runway ML), qui ont collectivement levé des centaines de millions en capital-risque. Google, Amazon et Microsoft pourraient également être considérés comme des rivaux, offrant leurs propres solutions pour développer, lancer et maintenir des modèles d’apprentissage automatique dans le cloud. (Voir SageMaker, AutoML et les outils ML sans code d’Azure).

Alors, qu’est-ce qui distingue Replicate ? Firshman affirme que l’expérience du développeur est « bien meilleure », ce qui reste bien sûr à voir – après tout, Replicate est tout nouveau. Un point de différenciation clair, cependant, est l’étendue de la bibliothèque d’IA de Replicate. La plate-forme propose des modèles de diffusion, notamment Stable Diffusion, des modèles de création et d’édition de vidéos, des modèles de mise à l’échelle pour les images et divers modèles image-texte et texte-image.

Un déploiement rapide et indolore est l’objectif. Le site Web de Replicate promet : « Avec Replicate et des outils comme Next.js et Vercel, vous pouvez vous réveiller avec une idée et la voir apparaître en première page de Hacker News au moment où vous vous couchez. »

Le marketing semble trouver un écho auprès de la communauté des développeurs, qui a adopté avec enthousiasme Replicate au cours des derniers mois – du moins selon Firshman. Il dit que la plate-forme a enregistré une croissance de 149 % d’un mois sur l’autre des utilisateurs actifs et une croissance de 125 % des appels d’API depuis le milieu de l’année dernière. Les clients d’entreprise incluent Character.ai, Labelbox et Unsplash.

« Nous avons effectivement indexé la croissance de l’IA générative », a déclaré Firshman. « Les fondateurs créent des tonnes de nouveaux produits, les investisseurs y investissent et les utilisateurs réclament toutes ces nouveautés. »

Se pencher sur l’IA générative est certainement une sage décision de la part de Replicate. Le segment – ​​dans lequel tombent des technologies comme ChatGPT et Stable Diffusion – a connu une augmentation massive des investissements au cours des dernières années. PitchBook (via Bezinga) rapporte que les VC ont investi 425 % de dollars supplémentaires dans l’IA générative en 2022 par rapport à 2020, l’espace atteignant 2,1 milliards de dollars de capital total promis en 2022.

Firshman voit la croissance se poursuivre – et Replicate en bénéficier.

« Il n’est pas encore entré dans la conscience de l’entreprise à quel point l’IA générative va bouleverser tant de secteurs de leur activité : support client, marketing, ventes, création de contenu et probablement d’autres choses que nous n’avons pas encore anticipées », a-t-il déclaré. « Très bientôt, le support client sera principalement automatisé et extrêmement bon – pas les terribles chatbots du passé. La création d’actifs pour le marketing sera principalement automatisée. La plupart des publicités que vous voyez seront automatiquement générées et personnalisées. La création d’actifs pour les jeux vidéo sera principalement automatisée. Et c’est avec la technologie que nous avons aujourd’hui.

Source-146