Plusieurs instances Chat GPT se combinent pour comprendre la chimie

Agrandir / Le laboratoire est vide parce que tout le monde se détend dans le parc pendant que l’IA fait son travail.

Malgré les progrès rapides de l’intelligence artificielle, les IA sont loin d’être prêtes à remplacer les humains dans la science. Mais cela ne veut pas dire qu’ils ne peuvent pas aider à automatiser une partie des corvées du quotidien de l’expérimentation scientifique. Par exemple, il y a quelques années, des chercheurs ont placé une IA aux commandes d’équipements de laboratoire automatisés et lui ont appris à cataloguer de manière exhaustive toutes les réactions pouvant se produire entre un ensemble de matières premières.

Bien qu’utile, cela nécessitait néanmoins l’intervention de nombreux chercheurs pour former le système en premier lieu. Un groupe de l’Université Carnegie Mellon a maintenant compris comment faire en sorte qu’un système d’IA apprenne à faire de la chimie. Le système nécessite un ensemble de trois instances d’IA, chacune spécialisée pour différentes opérations. Mais, une fois installé et alimenté en matières premières, il vous suffit de lui dire quel type de réaction vous souhaitez effectuer, et il le comprendra.

Une trinité IA

Les chercheurs indiquent qu’ils souhaitaient comprendre quelles capacités les grands modèles linguistiques (LLM) peuvent apporter à l’effort scientifique. Ainsi, tous les systèmes d’IA utilisés dans ce travail sont des LLM, principalement GPT-3.5 et GPT-4, bien que d’autres (Claude 1.3 et Falcon-40B-Instruct) aient également été testés. (GPT-4 et Claude 1.3 ont obtenu les meilleurs résultats.) Mais, plutôt que d’utiliser un système unique pour gérer tous les aspects de la chimie, les chercheurs ont mis en place des instances distinctes pour coopérer dans une configuration de division du travail et l’ont appelé « Coscientist ».

Les trois systèmes qu’ils ont utilisés sont :

Chercheur Web. Cela a deux capacités principales. La première consiste à utiliser l’API de recherche de Google pour trouver des pages qui pourraient valoir la peine d’être ingérées pour les informations qu’elles contiennent. La seconde consiste à ingérer ces pages et à en extraire des informations. Pensez-y comme au contexte des premières parties d’une conversation que Chat GPT peut entretenir pour éclairer ses réponses ultérieures. Les chercheurs ont pu suivre où ce module passait son temps, et environ la moitié des endroits visités étaient des pages Wikipédia. Les cinq principaux sites visités comprenaient les revues publiées par l’American Chemical Society et la Royal Society of Chemistry.

Chercheur de documentation. Considérez cela comme l’instance RTFM. L’IA allait se voir confier le contrôle de divers équipements d’automatisation de laboratoire, tels que des gestionnaires de fluides robotisés, etc., souvent contrôlés via des commandes spécialisées ou quelque chose comme une API Python. Cette instance d’IA a eu accès à tous les manuels de cet équipement, lui permettant ainsi de comprendre comment le contrôler.

Planificateur. Le planificateur peut émettre des commandes aux deux autres instances d’IA et traiter leurs réponses. Il a accès à un bac à sable Python pour exécuter du code, lui permettant d’effectuer des calculs. Il a également accès à l’équipement automatisé du laboratoire, ce qui lui permet de réaliser et d’analyser des expériences. Vous pouvez donc considérer le planificateur comme la partie du système qui doit agir comme un chimiste, apprenant de la littérature et essayant d’utiliser l’équipement pour mettre en œuvre ce qu’il a appris.

Le planificateur est également capable de déterminer quand des erreurs logicielles se produisent (soit dans ses scripts Python, soit dans ses tentatives de contrôle du matériel automatisé), lui permettant ainsi de corriger ses erreurs.

Mettre le système à profit

Initialement, il était demandé au système de synthétiser un certain nombre de produits chimiques tels que l’acétaminophène et l’ibuprofène, confirmant qu’il pouvait généralement trouver une synthèse viable après une recherche sur le Web et dans la littérature scientifique. La question est donc de savoir si le système pourrait comprendre suffisamment bien le matériel auquel il avait accès pour mettre à profit sa capacité conceptuelle.

Pour commencer avec quelque chose de simple, les chercheurs ont utilisé une plaque d’échantillonnage standard, qui contient un ensemble de petits puits disposés selon une grille rectangulaire. Le système a été invité à remplir des carrés, des rayures diagonales ou d’autres motifs à l’aide de divers liquides colorés et a réussi à le faire efficacement.

À partir de là, ils ont placé trois solutions de couleurs différentes à des endroits aléatoires dans la grille de puits ; il a été demandé au système d’identifier quels puits étaient de quelle couleur. À lui seul, Coscientist ne savait pas comment procéder. Mais lorsqu’on lui a demandé de lui rappeler que les différentes couleurs présenteraient des spectres d’absorption différents, il a utilisé un spectrographe auquel il avait accès et a pu identifier les différentes couleurs.

Les systèmes de commande et de contrôle de base semblant fonctionner, les chercheurs ont décidé d’essayer un peu de chimie. Ils ont fourni une plaque d’échantillon avec des puits remplis de produits chimiques simples, de catalyseurs, etc., et lui ont demandé d’effectuer une réaction chimique spécifique. Coscientist a compris la chimie dès le début, mais ses tentatives pour exécuter la synthèse ont échoué car il a envoyé une commande invalide au matériel qui chauffe et agite les réactions. Cela l’a renvoyé au module Documentation, lui permettant de corriger le problème et d’exécuter des réactions.

Et ça a marché. Les signatures spectrales des produits souhaités étaient présentes dans le mélange réactionnel et leur présence a été confirmée par chromatographie.

Optimisation

Une fois les réactions de base fonctionnant, les chercheurs ont ensuite demandé au système d’améliorer l’efficacité de la réaction. Ils ont présenté le processus d’optimisation comme un jeu dans lequel le score augmenterait avec le rendement de la réaction.

Le système a fait quelques mauvaises suppositions lors de la première série de réactions de test, mais s’est rapidement concentré sur de meilleurs rendements. Les chercheurs ont également découvert qu’ils pouvaient éviter les mauvais choix au premier tour en fournissant à Coscientist des informations sur les rendements générés par une poignée de mélanges de départ aléatoires. Cela implique que peu importe où Coscientist obtient ses informations – que ce soit à partir de réactions qu’il génère ou d’une source d’informations externe – il est capable d’incorporer ces informations dans sa planification.

Les chercheurs concluent que Coscientist possède plusieurs capacités notables :

  • Planification de la synthèse chimique à l’aide de l’information publique
  • Navigation et traitement des manuels techniques pour le matériel complexe
  • Utiliser ces connaissances pour contrôler une gamme d’équipements de laboratoire
  • Intégration de ces capacités de gestion matérielle dans un flux de travail de laboratoire
  • Analyser ses propres réactions et utiliser ces informations pour concevoir des conditions de réaction améliorées.

À bien des égards, cela ressemble à l’expérience qu’un étudiant pourrait vivre en première année d’études supérieures. Idéalement, l’étudiant diplômé progressera au-delà de cela. Mais peut-être que GPT-5 le pourra aussi.

Plus sérieusement, la structure du Coscientist, qui repose sur l’interaction d’un certain nombre de systèmes spécialisés, est similaire au fonctionnement du cerveau. De toute évidence, les systèmes spécialisés du cerveau sont capables d’un éventail d’activités beaucoup plus large, et ils sont bien plus nombreux. Mais il se peut que ce type de structure soit essentiel pour permettre un comportement plus complexe.

Cela dit, les chercheurs eux-mêmes s’inquiètent de certaines capacités du Coscientist. Il existe de nombreux produits chimiques (pensez à des choses comme les gaz neurotoxiques) que nous ne voulons pas voir rendus plus faciles à synthétiser. Et trouver comment dire aux instances GPT de ne pas faire quelque chose est devenu un défi permanent.

Nature, 2023. DOI : 10.1038/s41586-023-06792-0 (À propos des DOI).

Source-147