Domaine parallèle met la capacité de générer des ensembles de données synthétiques entre les mains de ses clients. La startup basée à San Francisco a lancé une nouvelle API appelée Data Lab qui s’appuie sur les géants de l’IA générative, donnant aux ingénieurs en apprentissage automatique le contrôle sur des mondes virtuels dynamiques pour simuler n’importe quel scénario imaginable.
« Tout ce que vous avez à faire est d’aller sur GitHub, d’installer l’API, puis de commencer à écrire du code Python qui génère des ensembles de données », a déclaré Kevin McNamara, fondateur et PDG de Parallel Domain, à TechCrunch.
Data Lab permet aux ingénieurs de générer des objets qui n’étaient pas disponibles auparavant dans la bibliothèque d’actifs de la startup. L’API utilise la simulation 3D pour fournir une base sur laquelle un ingénieur, grâce à une série d’invites simples, peut superposer le monde réel dans tout son caractère aléatoire. Vous voulez entraîner votre modèle à conduire sur une autoroute avec un taxi renversé sur deux voies ? Facile. Vous pensez que votre robotaxi devrait savoir identifier un humain vêtu d’une tenue de dinosaure gonflable ? Fait.
L’objectif est de donner aux entreprises d’autonomie, de drones et de robotique plus de contrôle et plus d’efficacité dans la construction de grands ensembles de données afin qu’elles puissent former leurs modèles plus rapidement et à un niveau plus profond.
« Le temps d’itération va maintenant essentiellement à quelle vitesse pouvez-vous, en tant qu’ingénieur ML, penser à ce que vous voulez et traduire cela en un appel API, un ensemble de code ? » dit McNamara. « Il y a un niveau presque infini et illimité de choses qu’un client peut saisir pour une invite, et le système fonctionne tout simplement. »
Parallel Domain compte parmi ses clients les principaux équipementiers qui construisent des systèmes avancés d’aide à la conduite (ADAS) et des sociétés de conduite autonome. Historiquement, il fallait parfois des semaines ou des mois à la startup pour créer des ensembles de données basés sur les paramètres spécifiques d’un client. Avec l’API en libre-service, les clients peuvent créer de nouveaux ensembles de données en « temps quasi réel », selon McNamara.
À plus grande échelle, Data Lab pourrait aider à faire évoluer les systèmes de conduite autonome encore plus rapidement. McNamara a déclaré que la startup a testé certains modèles AV sur des ensembles de données synthétiques de poussettes par rapport à des ensembles de données réels de poussettes, et a constaté que le modèle fonctionnait mieux lorsqu’il était formé sur des données synthétiques.
Alors que Parallel Domain n’utilise aucune des API d’IA ouvertes qui ont gagné en popularité ces derniers mois comme ChatGPT, la startup construit des composants de sa technologie sur les grands modèles de base qui ont été open source au cours des deux dernières années.
« Des choses comme Stable Diffusion nous permettent d’affiner nos propres versions de ces modèles de base, puis d’utiliser la saisie de texte pour piloter la génération d’images et de contenu », a déclaré McNamara, notant que son équipe a développé des piles technologiques personnalisées pour étiqueter les objets au fur et à mesure de leur génération.
Parallel Domain a initialement lancé son moteur de génération de données synthétiques, appelé Reactor, en mai pour un usage interne et des tests bêta avec des clients de confiance. Maintenant que Reactor est proposé aux clients via l’API Data Lab, le modèle commercial de Parallel Domain va probablement changer car les clients préfèrent un accès facile à l’IA générative.
La stratégie commerciale de la startup consiste aujourd’hui à ce que les clients achètent des lots de données puis utilisent ces crédits tout au long de l’année. Data Lab peut aider Parallel Domain à passer à un modèle de logiciel en tant que service (SaaS), où les clients peuvent s’abonner pour accéder à la plate-forme et payer en fonction de leur utilisation, a déclaré McNamara.
L’API a également le potentiel d’aider Parallel Domain à évoluer dans n’importe quel espace où la technologie de vision par ordinateur rend les industries plus efficaces, comme l’agriculture, la vente au détail ou la fabrication.
« L’activation de l’IA dans l’agriculture est considérée comme l’une des plus grandes choses qui amélioreront l’efficacité, et nous voulons aller chercher ces cas d’utilisation et éventuellement avoir une plate-forme où, quel que soit le domaine dans lequel vous opérez, si vous avez besoin de former une IA pour voir le monde avec une sorte de capteur, le point de départ est Parallel Domain », a déclaré McNamara.