L’année dernière, Salesforce, la société la plus connue pour son logiciel d’aide aux ventes dans le cloud (et Slack), a dirigé un projet appelé ProGen pour concevoir des protéines à l’aide de l’IA générative. Un projet de recherche, ProGen pourrait – s’il est mis sur le marché – aider à découvrir des traitements médicaux plus rentables que les méthodes traditionnelles, ont affirmé les chercheurs à l’origine de ce projet dans un article de blog de janvier 2023.
ProGen a abouti à une recherche publiée dans la revue Nature Biotech montrant que l’IA pouvait créer avec succès les structures 3D de protéines artificielles. Mais, au-delà du papier, le projet n’a pas apporté grand-chose chez Salesforce ou ailleurs – du moins pas au sens commercial.
Autrement dit, jusqu’à récemment.
L’un des chercheurs responsables de ProGen, Ali Madani, a lancé une société, Profluent, qui, espère-t-il, permettra de sortir du laboratoire une technologie similaire de génération de protéines et de la mettre entre les mains des sociétés pharmaceutiques. Dans une interview avec TechCrunch, Madani décrit la mission de Profluent comme « inverser le paradigme du développement de médicaments », en commençant par les besoins thérapeutiques et des patients et en travaillant à rebours pour créer une solution de traitement « sur mesure ».
« De nombreux médicaments – les enzymes et les anticorps, par exemple – sont constitués de protéines », a déclaré Madani. « En fin de compte, cela s’adresse aux patients qui recevraient une protéine conçue par l’IA comme médicament. »
Au sein de la division de recherche de Salesforce, Madani s’est trouvé attiré par les parallèles entre le langage naturel (par exemple l’anglais) et le « langage » des protéines. Les protéines – des chaînes d’acides aminés liés ensemble que le corps utilise à diverses fins, de la fabrication d’hormones à la réparation des tissus osseux et musculaires – peuvent être traitées comme des mots dans un paragraphe, a découvert Madani. Introduites dans un modèle d’IA génératif, les données sur les protéines peuvent être utilisées pour prédire des protéines entièrement nouvelles dotées de nouvelles fonctions.
Avec Profluent, Madani et le co-fondateur Alexander Meeske, professeur adjoint de microbiologie à l’Université de Washington, visent à pousser le concept un peu plus loin en l’appliquant à l’édition génétique.
« De nombreuses maladies génétiques ne peuvent être guéries par [proteins or enzymes] tiré directement de la nature », a déclaré Madani. « De plus, les systèmes d’édition génétique mélangés et adaptés à de nouvelles capacités souffrent de compromis fonctionnels qui limitent considérablement leur portée. En revanche, Profluent peut optimiser plusieurs attributs simultanément pour obtenir une conception personnalisée. [gene] éditeur qui convient parfaitement à chaque patient.
Ce n’est pas hors du champ gauche. D’autres entreprises et groupes de recherche ont démontré des moyens viables d’utiliser l’IA générative pour prédire les protéines.
Nvidia a publié en 2022 un modèle d’IA générative, MegaMolBART, qui a été formé sur un ensemble de données de millions de molécules pour rechercher des cibles potentielles de médicaments et prévoir des réactions chimiques. Meta a formé un modèle appelé ESM-2 sur des séquences de protéines, une approche qui, selon la société, lui a permis de prédire les séquences de plus de 600 millions de protéines en seulement deux semaines. Et DeepMind, le laboratoire de recherche en IA de Google, dispose d’un système appelé AlphaFold qui prédit les structures complètes des protéines, atteignant une vitesse et une précision dépassant de loin les méthodes algorithmiques plus anciennes et moins complexes.
Profluent entraîne des modèles d’IA sur des ensembles de données massifs – des ensembles de données contenant plus de 40 milliards de séquences protéiques – pour créer de nouveaux systèmes d’édition de gènes et de production de protéines ainsi que pour affiner les systèmes existants. Plutôt que de développer elle-même des traitements, la startup envisage de collaborer avec des partenaires extérieurs pour produire des « médicaments génétiques » dotés des voies d’approbation les plus prometteuses.
Madani affirme que cette approche pourrait réduire considérablement le temps – et le capital – généralement requis pour développer un traitement. Selon le groupe industriel PhRMA, il faut en moyenne 10 à 15 ans pour développer un nouveau médicament, depuis la découverte initiale jusqu’à l’approbation réglementaire. Des estimations récentes évaluent le coût du développement d’un nouveau médicament entre plusieurs centaines de millions et 2,8 milliards de dollars.
« De nombreux médicaments efficaces ont en fait été découverts accidentellement, plutôt que conçus intentionnellement », a déclaré Madani. « [Profluent’s] Cette capacité offre à l’humanité une chance de passer d’une découverte accidentelle à une conception intentionnelle de nos solutions les plus nécessaires en biologie.
Profluent, basé à Berkeley et comptant 20 employés, est soutenu par des poids lourds du capital-risque, notamment Spark Capital (qui a dirigé le récent cycle de financement de 35 millions de dollars de l’entreprise), Insight Partners, Air Street Capital, AIX Ventures et Convergent Ventures. Jeff Dean, scientifique en chef de Google, a également contribué, conférant ainsi un crédit supplémentaire à la plateforme.
Au cours des prochains mois, Profluent se concentrera sur la mise à niveau de ses modèles d’IA, en partie en élargissant les ensembles de données de formation, explique Madani, et en acquérant des clients et des partenaires. Il faudra agir de manière agressive ; ses rivaux, dont EvolutionaryScale et Basecamp Research, forment rapidement leurs propres modèles de génération de protéines et lèvent d’énormes sommes d’argent en capital-risque.
« Nous avons développé notre plateforme initiale et réalisé des avancées scientifiques dans le domaine de l’édition génétique », a déclaré Madani. « Il est maintenant temps d’évoluer et de commencer à proposer des solutions avec des partenaires qui correspondent à nos ambitions pour l’avenir. »