jeudi, décembre 19, 2024

Le marché des données synthétiques est plus grand que vous ne le pensez

« D’ici 2024, 60 % des données utilisées pour le développement de projets d’IA et d’analyse seront générées synthétiquement. Il s’agit d’une prédiction de Gartner que vous trouverez dans presque tous les articles, présentations ou communiqués de presse liés aux données synthétiques.

Nous répétons ici cette citation malgré son omniprésence car elle en dit long sur le marché total adressable des données synthétiques.

Déballons : premièrement, décrire des données synthétiques « générées synthétiquement » peut sembler tautologique, mais c’est aussi assez clair : nous parlons de données artificielles/fausses et créés plutôt que rassemblés dans le monde réel.

Ensuite, il y a le cœur de la prédiction – que les données synthétiques seront utilisées dans le développement de la plupart des projets d’IA et d’analyse. Étant donné que de tels projets sont en augmentation, la corrélation est que le marché des données synthétiques est également appelé à croître.

Le dernier mais non le moindre est l’horizon temporel. Dans notre monde de startups, 2024 est presque aujourd’hui, et les gens de Gartner ont déjà une prédiction à plus long terme : certains membres de son équipe ont publié une étude intitulée « Oubliez vos données réelles – Les données synthétiques sont l’avenir de l’IA ».

« L’avenir de l’IA » est le genre de promesse que les investisseurs aiment entendre, il n’est donc pas surprenant que des chèques affluent vers les startups de données synthétiques.

Rien qu’en 2022, MOSTLY AI a levé un tour de table de série B de 25 millions de dollars dirigé par Molten Ventures; Datagen a décroché une série B de 50 millions de dollars dirigée par Scale Venture Partners, et Synthesis AI a empoché une série A de 17 millions de dollars.

Les startups de données synthétiques qui ont levé des fonds importants desservent déjà un large éventail de secteurs, de la banque et de la santé aux transports et au commerce de détail. Mais ils s’attendent à ce que les cas d’utilisation continuent de se développer, à la fois dans de nouveaux secteurs et dans ceux où les données synthétiques sont déjà courantes.

Pour comprendre ce qui se passe, mais aussi ce qui s’en vient si les données synthétiques sont plus largement adoptées, nous avons parlé à divers PDG et VC au cours des derniers mois. Nous avons découvert les deux principales catégories d’entreprises de données synthétiques, les secteurs auxquels elles s’adressent, comment dimensionner le marché et plus encore.

Le sommet de l’iceberg

L’associée fondatrice de Quiet Capital, Astasia Myers, fait partie des investisseurs optimistes quant aux données synthétiques et à leurs applications. Elle a refusé de révéler si elle avait investi dans cet espace, mais a déclaré qu ‘«il y a de quoi être enthousiasmé dans le monde des données synthétiques».

Pourquoi cet enthousiasme ? « Parce que cela donne aux équipes un accès plus rapide aux données de manière sécurisée à moindre coût », a-t-elle déclaré à TechCrunch.

« Nous pouvons simplement dire que le TAM des données synthétiques et le TAM des données vont converger. » Ofir Zuk (Chakon)

L’accès à de grandes quantités de données est devenu essentiel pour les équipes d’apprentissage automatique, et les données réelles ne sont souvent pas à la hauteur de la tâche, pour différentes raisons. C’est le vide que les startups de données synthétiques espèrent combler.

Il existe deux contextes principaux dans lesquels ces startups se concentrent : les données structurées et les données non structurées. Le premier fait référence au type d’ensembles de données qui se trouvent dans des tableaux et des feuilles de calcul, tandis que le second pointe vers ce que nous pourrions appeler des fichiers multimédias, tels que des données audio, textuelles et visuelles.

« Il est logique de faire la distinction entre les sociétés de données synthétiques structurées et non structurées », a déclaré Myers, « parce que le type de données synthétiques est appliqué à différents cas d’utilisation et donc à différents acheteurs ».

Source-146

- Advertisement -

Latest