La mission d’Arrikto est de permettre aux scientifiques des données de construire et de déployer plus rapidement leurs modèles d’apprentissage automatique. La société, qui a levé un tour de table de série A de 10 millions de dollars fin 2020, construit sa plate-forme au-dessus de Kubeflow, un projet open source cloud natif pour la création d’opérations d’apprentissage automatique qui a été initialement développé par Google mais qui est maintenant principalement géré par le communauté. Jusqu’à présent, le produit principal d’Arrikto était une distribution d’entreprise autogérée de Kubeflow pour les entreprises (bien nommées « Enterprise Kubeflow ») qui souhaitaient l’exécuter dans leurs centres de données ou leurs clouds privés virtuels. Aujourd’hui, la société lance également une version entièrement gérée de Kubeflow.
« Pousser les modèles ML de l’expérimentation jusqu’à la production est incroyablement complexe », m’a dit le PDG et co-fondateur d’Arrikto, Constantinos Venetsanopoulos. «Nous voyons quelques raisons communes à cela. Premièrement, les scientifiques des données ne sont essentiellement pas des experts des opérations et les gens des opérations ne sont pas des scientifiques des données – et ils ne veulent pas devenir des scientifiques des données. Deuxièmement, nous avons assisté à une explosion des outils de ML au cours des deux dernières années. Ils sont extrêmement fragmentés et nécessitent beaucoup d’intégration. Ce que nous voyons, ce sont des gens qui luttent pour tout assembler. Ces deux facteurs créent une énorme barrière à l’entrée.
Avec son Kubeflow entièrement géré, Arrikto vise à offrir aux entreprises une plate-forme qui peut les aider à accélérer leurs pipelines ML et à libérer les scientifiques des données d’avoir à se soucier de l’infrastructure, tout en leur permettant de continuer à utiliser les outils qu’ils connaissent déjà (pensez notebooks, TensorFlow, PyTorch, Hugging Face, etc.). « Nous voulons briser la barrière technique qui empêche la plupart des entreprises de déployer de véritables capacités d’apprentissage automatique », a déclaré Venetsanopoulos.
Avec Kubeflow en tant que service, affirme la société, les scientifiques des données auront un accès instantané à une plate-forme MLops de bout en bout. Il s’agit essentiellement d’Enterprise Kubeflow d’Arrikto avec de nombreux outils d’automatisation personnalisés en plus pour supprimer tous les détails de la plate-forme Kubernetes sur laquelle elle repose.
Pour l’instant, Arrikto ne fonctionnera que sur un seul cloud, mais à long terme, le plan est de prendre en charge les trois principaux fournisseurs de cloud pour garantir de faibles latences (et réduire la nécessité de déplacer de nombreuses données entre les clouds).
Fait intéressant, Venetsanopoulos affirme que le plus grand concurrent de l’entreprise à l’heure actuelle n’est pas d’autres services gérés comme SageMaker d’AWS, mais des entreprises essayant de créer leurs propres plates-formes en assemblant des outils open source.
« Kubeflow en tant que service offre aux scientifiques des données et aux ingénieurs DevOps le moyen le plus simple d’utiliser une plate-forme MLOps sur Kubernetes sans avoir à demander d’infrastructure à leurs services informatiques », a déclaré Venetsanopoulos. « Lorsqu’une organisation déploie Kubeflow en production, que ce soit sur site ou dans le cloud, Kubeflow en tant que service d’Arrikto accélère le processus. »
L’entreprise, qui compte aujourd’hui une soixantaine d’employés, continuera à proposer Kubeflow Enterprise en plus de ce nouveau service entièrement managé.