Un nouveau rapport met en évidence la demande de startups créant des outils et des technologies open source pour la révolution boule de neige de l’IA, avec le secteur vertical de l’infrastructure de données adjacente qui s’échauffe également.
Runa Capital, la société de capital-risque (VC) qui a dépassé la Silicon Valley et a déménagé son siège social au Luxembourg en 2022, a publié l’indice Runa Open Source Startup (ROSS) au cours des quatre dernières années, mettant en lumière les startups à la croissance la plus rapide. startups de logiciels commerciaux open source (COSS). La société publie des mises à jour trimestrielles, mais l’année dernière, elle a produit son premier rapport annuel présentant une vue descendante de l’ensemble de 2022 – ce qu’elle répète maintenant pour 2023.
Les tendances
Les données sont étroitement liées à l’IA, car l’IA s’appuie sur les données pour apprendre et faire des prédictions, ce qui nécessite une infrastructure pour gérer la collecte, le stockage et le traitement de ces données. Et ces tendances tangentielles se heurtent dans ce rapport.
LangChain, une startup de deux ans basée à San Francisco, qui a développé un framework open source pour créer des applications basées sur de grands modèles de langage (LLM), a atteint la première place de l’indice ROSS l’année dernière. Le projet principal de la société a dépassé 72 500 étoiles en 2023, Sequoia ayant ensuite mené un tour de série A de 25 millions de dollars dans LangChain le mois dernier.
Ailleurs dans le top 10 se trouve Reflex, un framework open source pour la création d’applications Web en Python pur, la société à l’origine du produit ayant récemment obtenu un investissement initial de 5 millions de dollars ; AITable, un constructeur de chatbot IA basé sur une feuille de calcul et quelque chose qui s’apparente à un concurrent open source d’Airtable ; Sismo, une plateforme axée sur la confidentialité qui permet aux utilisateurs de divulguer de manière sélective des données personnelles aux applications ; HPC-AI, qui construit une plate-forme distribuée de développement et de déploiement d’IA dans le but de devenir quelque chose comme l’OpenAI de l’Asie du Sud-Est ; et la base de données vectorielles open source Qdrant, qui a récemment obtenu 28 millions de dollars pour capitaliser sur la révolution naissante de l’IA.
Un examen plus large du « top 50 des startups open source les plus tendances » l’année dernière révèle que plus de la moitié (26) sont liées à l’IA et à l’infrastructure de données.
Il est difficile de comparer correctement l’indice 2023 avec l’année précédente d’un point de vue vertical, en grande partie en raison du fait que les entreprises modifient ou modifient souvent le positionnement de leurs produits pour s’adapter à l’actualité du moment. Avec le battage médiatique ChatGPT qui a atteint son plein régime l’année dernière, cela a peut-être conduit les startups en phase de démarrage à modifier leur orientation, ou même simplement à mettre davantage l’accent sur l’élément « IA » existant de leur produit.
Mais en tant qu’année révolutionnaire de l’IA générative, il est facile de comprendre pourquoi la demande de composants open source pourrait monter en flèche, alors que les entreprises de toutes tailles cherchent à suivre le rythme des poids lourds de l’IA propriétaires tels qu’OpenAI, Microsoft et Google.
Géographies
Les logiciels open source ont également toujours été très distribués, avec la contribution de développeurs du monde entier. Cette philosophie se traduit souvent par des startups commerciales open source qui peuvent ne pas avoir de centre de gravité traditionnel ancré dans un siège social physique.
Cependant, l’indice ROSS contribue dans une certaine mesure à intégrer la géographie, en indiquant que 26 entreprises figurant sur la liste ont un siège social aux États-Unis, même si 10 de ces entreprises sont originaires d’ailleurs et ont toujours des fondateurs ou des employés basés dans d’autres régions.
Au total, les 50 premières sociétés provenaient de 17 pays différents, avec 23 sociétés constituées en Europe, soit une hausse de 20 % par rapport à l’indice de l’année précédente. La France compte le plus grand nombre de startups COSS avec sept, dont Sismo et Massa qui figurent dans le top 10, tandis que le Royaume-Uni est passé d’une seule startup en 2022 à six en 2023, ce qui le place à la deuxième place d’un point de vue européen.
Parmi les autres éléments notables qui ressortent du rapport figurent les langages de programmation : l’indice ROSS a enregistré 12 langages utilisés par les 50 premiers l’année dernière, contre 10 en 2022. Mais Typescript, un sur-ensemble JavaScript développé par Microsoft, est resté le plus populaire, utilisé par 38 %. des 50 meilleures startups. Python et Rust ont gagné en popularité, avec la chute de Go et JavaScript.
Les 50 principaux participants à l’indice ROSS ont collectivement gagné 12 000 contributeurs en 2023, tandis que le nombre global d’étoiles GitHub a augmenté de près de 500 000. L’indice révèle également que le financement des 50 meilleures startups COSS a atteint l’année dernière 513 millions de dollars, soit une augmentation de 32 % par rapport à 2022 et de 145 % par rapport à 2021.
Méthodologie & contexte
Cela vaut la peine d’examiner la méthodologie derrière tout cela : quels facteurs influencent le fait qu’une entreprise soit considérée comme « la plus tendance » ? Pour commencer, toutes entreprises confondues doit avoir au moins 1 000 étoiles GitHub (une métrique GitHub similaire à un « j’aime » dans les médias sociaux) pour être pris en compte. Mais le nombre d’étoiles à lui seul ne nous dit pas grand-chose sur les tendances, étant donné que les étoiles s’accumulent au fil du temps. Ainsi, un projet qui est sur GitHub depuis 10 ans aura probablement accumulé plus d’étoiles qu’un projet qui existe depuis 10 mois. Au lieu de cela, Runa mesure la croissance relative des étoiles sur une période donnée en utilisant un taux de croissance annualisé (AGR) – cela examine la valeur actuelle de l’étoile par rapport à une période correspondante précédente pour voir ce qui a connu la croissance la plus impressionnante.
Un certain degré de curation manuelle est également impliqué ici, étant donné que l’objectif est d’éliminer spécifiquement les « startups » open source – donc l’équipe d’investissement de Runa retire les projets qui appartiennent à une « organisation commerciale axée sur les produits », et elle doit ont été fondées il y a moins de dix ans avec moins de 100 millions de dollars de financement connu.
Définir ce qui constitue « l’open source » comporte également ses propres défis inhérents, car il existe un large éventail de degrés d’« open source » pour une startup – certaines s’apparentent davantage à un « noyau ouvert », où la plupart de leurs principales fonctionnalités sont verrouillées derrière un premium. paywall, et certains ont des licences plus restrictives que d’autres. Donc pour cela, les conservateurs de Runa ont décidé que la startup devait simplement avoir un produit qui soit « rraisonnablement connecté à ses référentiels open source », ce qui implique évidemment un certain degré de subjectivité lorsqu’il s’agit de décider lesquels seront retenus.
D’autres nuances entrent également en jeu. L’indice ROSS adopte une interprétation particulièrement libérale du terme « open source » : par exemple, Elastic et MongDB ont abandonné leurs racines open source au profit de licences « source disponible », afin de se protéger contre les abus des principaux fournisseurs de cloud. Selon la méthodologie de l’indice ROSS, ces deux sociétés seraient considérées comme « open source » – même si leurs licences ne sont pas formellement approuvées en tant que telles par l’Open Source Initiative, et ces exemples spécifiques d’entreprises ne se désignent plus comme « open source ».
Ainsi, selon la méthodologie de Runa, l’entreprise utilise pour son rapport ce qu’elle appelle la « perception commerciale de l’open source », plutôt que la licence réelle que l’entreprise attache à son projet. Cela signifie que les licences à source restreinte telles que BSL (licence de source commerciale) et SSPL (licence publique côté serveur), que MongoDB a introduites dans le cadre de sa transition vers l’open source en 2018, sont très présentes dans le menu des entreprises commerciales. dans l’indice ROSS est concerné.
« Ces licences préservent l’esprit OSS – toutes ses libertés, à l’exception d’une redistribution légèrement limitée, qui n’affecte pas les développeurs mais accorde aux fournisseurs d’origine un avantage concurrentiel à long terme », a expliqué à TechCrunch Konstantin Vinogradov, associé général de Runa Capital basé à Londres. « Du point de vue du capital-risque, il s’agit simplement d’un manuel évolué pour exactement le même type d’entreprises. La définition de l’open source s’applique aux produits logiciels, pas aux entreprises.
Il existe également d’autres filtres notables. Par exemple, les entreprises qui se concentrent principalement sur la fourniture de services professionnels, ou les projets parallèles avec un soutien actif limité ou sans élément commercial, ne sont pas inclus dans l’indice ROSS.
À des fins de comparaison, il existe d’autres index et listes qui donnent une idée de ce qui est chaud dans le paysage open source. Par exemple, une autre société de capital-risque appelée Two Sigma Ventures gère l’indice Open Source, dont le concept est similaire à celui de Runa, sauf qu’il couvre toutes sortes de projets open source (pas seulement les startups) et qu’il dispose de filtres supplémentaires, notamment la possibilité de visualiser par la métrique « observateurs » de GitHub, qui, selon certains, donne une image plus précise de la véritable popularité d’un projet.
GitHub lui-même publie également une page de référentiels de tendances, qui, comme Two Sigma Ventures, ne se concentre pas sur l’activité derrière le projet.
L’indice ROSS est donc apparu comme un outil complémentaire utile pour déterminer quelles « startups » open source méritent spécifiquement d’être surveillées.