Scale AI entre dans le jeu des données synthétiques

Le parcours de Scale AI pour devenir une entreprise de 7,3 milliards de dollars a été pavé de données réelles provenant d’images, de textes, de voix et de vidéos. Maintenant, il utilise cette base pour entrer dans le jeu des données synthétiques, l’une des catégories les plus chaudes et émergentes de l’IA.

Ils ont annoncé mercredi un programme d’accès anticipé à Scale Synthetic, un produit que les ingénieurs en apprentissage automatique peuvent utiliser pour améliorer leurs ensembles de données réels existants, selon la société. Scale a embauché deux cadres pour développer cette nouvelle division de son entreprise. Scale a embauché Joel Kronander, qui dirigeait auparavant l’apprentissage automatique chez Nines et était un ancien ingénieur en vision par ordinateur chez Apple travaillant sur la cartographie 3D, en tant que nouveau responsable des données synthétiques. La société a également embauché Vivek Raju Muppalla en tant que directeur des services synthétiques. Muppalla était auparavant directeur de l’ingénierie pour l’IA et la simulation chez Unity Technologies.

Les données synthétiques sont telles qu’elles paraissent : de fausses données qui ont été créées par des algorithmes d’apprentissage automatique plutôt que d’utiliser des informations du monde réel. Il peut s’agir d’un outil puissant et pratique pour générer des données – comme l’imagerie médicale – lorsque la confidentialité est une préoccupation majeure. Les développeurs peuvent utiliser des données synthétiques pour ajouter plus de complexité à leurs modèles de formation et aider à éliminer les biais qui peuvent souvent être trouvés dans les ensembles de données réelles collectées.

Mettez à l’échelle le logiciel initialement combiné avec des images réelles, du texte, des données vocales et vidéo étiquetées par des personnes pour donner aux entreprises de véhicules autonomes les données étiquetées nécessaires pour former des modèles d’apprentissage automatique pour développer et déployer des robotaxis, des camions autonomes et des robots automatisés utilisés dans les entrepôts et sur- exiger la livraison. La startup s’est depuis transformée en une société de plate-forme de gestion de données avec des clients couvrant les secteurs du gouvernement, de la finance, du commerce électronique, des véhicules autonomes et des entreprises.

Le fondateur et PDG Alexandr Wang a décrit sa nouvelle offre comme une approche hybride des données, semblable à de la viande cultivée en laboratoire.

« Nous commençons avec de vraies données, tout comme la façon dont la viande cultivée en laboratoire commence à partir de vraies cellules animales, puis grandit, itère et construit le produit à partir de là », a-t-il déclaré à TechCrunch. En utilisant des données du monde réel comme base pour créer des données synthétiques, la société est en mesure d’offrir une offre vraiment unique et puissante aux clients, a déclaré Wang, ajoutant qu’il s’agissait d’une lacune qu’ils voyaient sur le marché.

Les clients de Scale ont également constaté cet écart. La poussée de l’entreprise vers les données synthétiques répondait à la demande de ses clients, a déclaré Wang à TechCrunch, qui a déclaré avoir commencé à développer le produit il y a moins d’un an. Le développeur de technologies de véhicules autonomes Kodiak Robotics, Tractable AI et le département américain de la Défense ont tous fait appel à Scale pour son nouveau produit de données synthétiques, a déclaré Wang.

Scale, qui emploie aujourd’hui environ 450 employés, considère les données synthétiques comme une priorité absolue en 2022 et un domaine dans lequel elle continuera d’investir à mesure qu’elle développera sa gamme de produits. Mais cela ne signifie pas qu’il reprendra son activité de données réelles. Wang considère les données synthétiques comme un outil complémentaire qui aidera les développeurs à « tirer le meilleur parti de leurs algorithmes et autres IA, en particulier dans les cas extrêmes.

Par exemple, les entreprises de véhicules autonomes utilisent généralement la simulation pour recréer des scénarios du monde réel et les rejouer pour voir comment le système autonome les gérera. Mais les données du monde réel peuvent ne pas fournir le scénario qu’ils recherchent.

« Vous ne rencontrez pas trop souvent des scénarios dans le monde réel où il pourrait y avoir, disons, 100 cyclistes traversant à la fois », a expliqué Wang. « Nous pouvons partir de données du monde réel, puis ajouter synthétiquement tous les cyclistes ou toutes les personnes, puis de cette façon, vous pouvez former l’algorithme correctement. »

Source-146