mercredi, novembre 27, 2024

Predibase sort de la furtivité avec une plate-forme low-code pour la construction de modèles d’IA

Les équipes de science des données sont bloquées par la désorganisation de leurs entreprises, ce qui a un impact sur les efforts de déploiement de projets d’IA et d’analyse en temps opportun. Dans une récente enquête auprès des « responsables des données » dans des entreprises basées aux États-Unis, 44 % ont déclaré qu’ils n’avaient pas embauché suffisamment, qu’ils étaient trop isolés pour être efficaces et qu’ils n’avaient pas reçu de rôles clairs. Les répondants ont déclaré qu’ils étaient plus préoccupés par l’impact d’une perte de revenus ou d’une atteinte à la réputation de la marque résultant de systèmes d’IA défaillants et d’une tendance à des investissements étourdissants avec des gains à court terme.

Ce sont finalement des défis organisationnels. Mais Piero Molino, co-fondateur de la plateforme de développement d’IA Predibase, affirme qu’un outillage inadéquat les exacerbe souvent.

« Les principaux défis que nous constatons aujourd’hui dans l’industrie sont que les projets d’apprentissage automatique ont tendance à avoir un délai de rentabilisation allongé et un accès très limité dans l’ensemble de l’organisation. En conséquence, la plupart des tâches d’apprentissage automatique dans une organisation sont bloquées par une équipe de science des données centralisée sursouscrite », a déclaré Molino à TechCrunch par e-mail. « Compte tenu de ces défis, les organisations doivent aujourd’hui choisir entre deux approches erronées lorsqu’il s’agit de développer l’apprentissage automatique. Ils peuvent créer leurs propres systèmes, des données au déploiement, à l’aide d’API de bas niveau qui leur offrent la flexibilité dont les tâches d’apprentissage automatique ont généralement besoin au prix de la complexité. Ou ils peuvent choisir d’utiliser une solution « AutoML » prête à l’emploi qui simplifie leur problème au détriment de la flexibilité et du contrôle. »

En effet, alors que les dépenses mondiales en technologies d’IA étaient estimées à 35,8 milliards de dollars en 2019, près de 80 % des entreprises ont vu leurs projets d’IA stagner en raison de problèmes de qualité des données et d’un manque de confiance dans les systèmes d’IA, selon un rapport d’Alegion. En tant qu’entrepreneur (et vendeur), Molino affirme que son produit, Predibase, est une solution à cela – ou du moins un pas vers une solution.

Predibase, qui a émergé aujourd’hui furtivement avec un financement de série A de 16,25 millions de dollars dirigé par Greylock avec la participation de l’usine et d’investisseurs providentiels, permet à un utilisateur de spécifier un système d’IA sous la forme d’un fichier qui indique à la plate-forme ce que l’utilisateur veut (par exemple, reconnaître des objets dans une image) et trouve un moyen de combler ce besoin. Molino le décrit comme une approche «déclarative» du développement de l’IA, empruntant un terme à l’informatique qui fait référence au code écrit pour décrire ce qu’un développeur souhaite accomplir.

« Aujourd’hui, les projets d’apprentissage automatique prennent généralement de six mois à un an dans la plupart des organisations avec lesquelles nous avons travaillé. Nous voulons réduire considérablement cela [by bringing] un outil d’apprentissage automatique à faible code mais à plafond élevé pour les organisations », a poursuivi Molino. « En règle générale, la plupart des entreprises sont goulottées par les ressources en science des données, ce qui signifie que les équipes de produits et d’analystes sont bloquées par une ressource rare et coûteuse. Avec Predibase, nous avons vu des ingénieurs et des analystes construire et opérationnaliser directement des modèles.

Predibase s’appuie sur des technologies open source, notamment Horovod, un cadre pour la formation de modèles d’IA, et Ludwig, une suite d’outils d’apprentissage automatique. Les deux ont été initialement développés chez Uber, qui a transféré il y a plusieurs années la gouvernance des projets à la Fondation Linux.

Molino, qui a rejoint Uber par le biais de l’acquisition de la startup Geometric Intelligence par la société, a contribué à la création de Ludwig en 2019. L’autre co-fondateur de Predibase, Travis Addair, était le responsable principal d’Horovod tout en travaillant comme ingénieur logiciel senior chez Uber.

Pour lancer Predibase, Molino et Addair se sont associés à l’ancien chef de produit Google Cloud AI Devvret Rishi et au professeur d’informatique de Stanford Chris Ré, l’un des co-fondateurs de Lattice.io, une société d’exploration de données et d’apprentissage automatique qu’Apple a achetée en 2017.

Predibase est conçu pour permettre aux développeurs de définir des pipelines d’IA en quelques lignes de code tout en évoluant jusqu’à des pétaoctets de données sur des milliers de machines. Comme l’explique Molino, en utilisant la plate-forme, un utilisateur peut créer un système d’IA d’analyse de texte en six lignes de code qui spécifie les données d’entrée et de sortie. S’ils veulent itérer et personnaliser ce système, Predibase leur permet d’ajouter des paramètres dans le fichier de configuration qui offrent un niveau de contrôle plus granulaire.

Predibase s’intègre à des sources de données telles que Snowflake, Google BigQuery et Amazon S3 pour la formation de modèles. Les utilisateurs peuvent former des modèles via la plate-forme ou par programmation, selon le cas d’utilisation, puis héberger et servir ou déployer ces modèles dans des environnements de production locaux.

« En plus de réduire le délai de rentabilisation, Predibase permet aux utilisateurs de travailler avec différentes modalités de données en utilisant le même ensemble d’outils. Avec Predibase, nous avons vu des utilisateurs former des modèles sur des images pour la classification, des données textuelles telles que des e-mails pour le triage, des données tabulaires pour des tâches de détection et de régression, et même des ensembles de données audio qui auraient nécessité une sophistication interne élevée sans les capacités natives du plate-forme », a déclaré Molino. « Pour de nombreuses personnes travaillant dans cet espace, Predibase offre une nouvelle capacité nette pour aborder les cas d’utilisation sur des données non structurées. »

D’une manière générale, les plates-formes de développement sans code sont en hausse et un certain nombre de startups concurrencent directement Predibase, notamment la startup d’orchestration d’IA Union.ai et la plate-forme d’ingénierie de données low-code Prophecy (sans parler de SageMaker et Vertex AI). Mais le point de vue de Molino est que si les rivaux satisfont la demande de l’entreprise pour des solutions simples, ils le font au détriment de la flexibilité, ce qui amène les clients à « atteindre un plafond et à se dépêcher ».

« [L]Comme l’infrastructure en tant que code informatique simplifié, notre plate-forme permet aux utilisateurs de se concentrer sur le « quoi » de leurs modèles plutôt que sur le « comment », ce qui leur permet de s’affranchir des limites habituelles des systèmes low-code à l’aide d’une configuration extensible… Nous fournissons des modèles explicabilité prête à l’emploi afin que les utilisateurs puissent comprendre quelles fonctionnalités génèrent des prédictions », a-t-il déclaré. « [Our platform] a été utilisé dans des entreprises du Fortune 500 comme une entreprise technologique américaine de premier plan, une grande banque nationale et une grande entreprise de soins de santé américaine.

Le pitch a suffisamment impressionné des anges comme le PDG de Kaggle Anthony Goldbloom et l’ancien COO d’Intel AI Remi El-Ouazzane, qui ont tous deux investi. Parmi les autres bailleurs de fonds notables figurent Kaggle CTO Ben Hamner et Zoubin Ghahramani, professeur d’ingénierie de l’information à Cambridge et chercheur principal chez Google Brain.

Molino dit que le nouveau capital de la série A sera utilisé pour amener le produit bêta de Predibase sur un marché plus large – il est actuellement uniquement sur invitation. Il servira également à développer l’équipe d’ingénieurs en apprentissage automatique de Predibase et à mettre en place une organisation de mise sur le marché, en élargissant l’équipe de 21 personnes de l’entreprise.

Source-146

- Advertisement -

Latest