Ce logiciel d’IA a presque prédit la structure délicate d’Omicron

La façon dont les prédictions se sont précipitées avant les expériences sur la protéine de pointe d’Omicron reflète un récent changement radical dans la biologie moléculaire provoqué par l’IA. Le premier logiciel capable de prédire avec précision les structures des protéines est devenu largement disponible quelques mois seulement avant l’apparition d’Omicron, grâce aux équipes de recherche concurrentes du laboratoire d’IA DeepMind d’Alphabet au Royaume-Uni et de l’Université de Washington.

Ford a utilisé les deux packages, mais comme aucun n’a été conçu ou validé pour prédire de petits changements causés par des mutations comme celles d’Omicron, ses résultats ont été plus suggestifs que définitifs. Certains chercheurs les ont traités avec méfiance. Mais le fait qu’il puisse facilement expérimenter une puissante IA de prédiction de protéines illustre comment les récentes percées changent déjà la façon dont les biologistes travaillent et pensent.

Subramaniam dit qu’il a reçu quatre ou cinq e-mails de personnes proposant des structures de pointes Omicron prédites tout en travaillant sur les résultats de son laboratoire. « Beaucoup ont fait cela juste pour le plaisir », dit-il. Les mesures directes de la structure des protéines resteront l’étalon ultime, dit Subramaniam, mais il s’attend à ce que les prédictions de l’IA deviennent de plus en plus centrales pour la recherche, y compris sur les futures épidémies. « C’est transformateur, dit-il.

Parce que la forme d’une protéine détermine son comportement, connaître sa structure peut aider toutes sortes de recherches en biologie, des études sur l’évolution aux travaux sur la maladie. Dans la recherche sur les médicaments, déterminer la structure d’une protéine peut aider à révéler des cibles potentielles pour de nouveaux traitements.

Déterminer la structure d’une protéine est loin d’être simple. Ce sont des molécules complexes assemblées à partir d’instructions codées dans le génome d’un organisme pour servir d’enzymes, d’anticorps et de la plupart des autres mécanismes de la vie. Les protéines sont constituées de chaînes de molécules appelées acides aminés qui peuvent se plier en des formes complexes qui se comportent de différentes manières.

Le déchiffrement de la structure d’une protéine impliquait traditionnellement un travail de laboratoire minutieux. La plupart des quelque 200 000 structures connues ont été cartographiées à l’aide d’un processus délicat dans lequel les protéines sont formées en un cristal et bombardées de rayons X. Les techniques plus récentes comme la microscopie électronique utilisée par Subramaniam peuvent être plus rapides, mais le processus est encore loin d’être facile.

À la fin de 2020, l’espoir de longue date que les ordinateurs pourraient prédire la structure des protéines à partir d’une séquence d’acides aminés est soudain devenu réalité, après des décennies de lents progrès. Le logiciel DeepMind appelé AlphaFold s’est avéré si précis dans un concours de prédiction de protéines que le cofondateur du défi, John Moult, professeur à l’Université du Maryland, a déclaré le problème résolu. « Ayant travaillé personnellement sur ce problème pendant si longtemps », a déclaré Moult, la réalisation de DeepMind a été « un moment très spécial ».

Le moment a également été frustrant pour certains scientifiques : DeepMind n’a pas immédiatement divulgué les détails du fonctionnement d’AlphaFold. « Vous êtes dans cette situation étrange où il y a eu cette avancée majeure dans votre domaine, mais vous ne pouvez pas vous en inspirer », a déclaré à WIRED l’année dernière David Baker, dont le laboratoire de l’Université de Washington travaille sur la prédiction de la structure des protéines. Son groupe de recherche a utilisé des indices laissés par DeepMind pour guider la conception d’un logiciel open source appelé RoseTTAFold, sorti en juin, qui était similaire mais pas aussi puissant qu’AlphaFold. Les deux sont basés sur des algorithmes d’apprentissage automatique perfectionnés pour prédire les structures des protéines en s’entraînant sur une collection de plus de 100 000 structures connues. Le mois suivant, DeepMind a publié les détails de son propre travail et a publié AlphaFold pour que tout le monde puisse l’utiliser. Soudain, le monde avait deux façons de prédire les structures des protéines.

Minkyung Baek, chercheuse postdoctorale dans le laboratoire de Baker qui a dirigé les travaux sur RoseTTAFold, dit qu’elle a été surprise par la rapidité avec laquelle les prédictions de la structure des protéines sont devenues la norme dans la recherche en biologie. Google Scholar rapporte que les articles d’UW et de DeepMind sur leur logiciel ont été cités ensemble par plus de 1 200 articles universitaires depuis leur parution.

Bien que les prédictions ne se soient pas révélées cruciales pour travailler sur Covid-19, elle pense qu’elles deviendront de plus en plus importantes pour la réponse aux futures maladies. Les réponses à la pandémie ne proviendront pas entièrement d’algorithmes, mais les structures prédites peuvent aider les scientifiques à élaborer des stratégies. « Une structure prédite peut vous aider à concentrer vos efforts d’expérimentation sur les problèmes les plus importants », explique Baek. Elle essaie maintenant de faire en sorte que RoseTTAFold prédise avec précision la structure des anticorps et des protéines envahissantes lorsqu’ils sont liés ensemble, ce qui rendrait le logiciel plus utile pour les projets de maladies infectieuses.

Malgré leurs performances impressionnantes, les prédicteurs de protéines ne révèlent pas tout sur une molécule. Ils crachent une structure statique unique pour une protéine et ne capturent pas les flexions et les ondulations qui se produisent lorsqu’elle interagit avec d’autres molécules. Les algorithmes ont été formés sur des bases de données de structures connues, qui reflètent davantage les plus faciles à cartographier expérimentalement plutôt que la pleine diversité de la nature. Kresten Lindorff-Larsen, professeur à l’Université de Copenhague, prédit que les algorithmes seront utilisés plus fréquemment et seront utiles, mais déclare : « En tant que domaine, nous devons également mieux apprendre lorsque ces méthodes échouent. »

Source-144