DeepMind AI rivalise avec les lycéens les plus intelligents du monde en géométrie

Agrandir / Demis Hassabis, PDG de DeepMind Technologies et développeur d’AlphaGO, participe au AI Safety Summit à Bletchley Park le 2 novembre 2023 à Bletchley, en Angleterre.

Un système développé par DeepMind de Google a établi un nouveau record de performances de l’IA sur les problèmes de géométrie. AlphaGeometry de DeepMind a réussi à résoudre 25 des 30 problèmes de géométrie tirés de l’Olympiade mathématique internationale entre 2000 et 2022.

Cela place le logiciel devant la grande majorité des jeunes mathématiciens et juste en dessous des médaillés d’or de l’OMI. DeepMind estime qu’un médaillé d’or moyen aurait résolu 26 problèmes sur 30. Beaucoup considèrent l’OMI comme le concours de mathématiques le plus prestigieux au monde pour les lycéens.

« Parce que les modèles linguistiques excellent dans l’identification de modèles généraux et de relations dans les données, ils peuvent rapidement prédire des constructions potentiellement utiles, mais n’ont souvent pas la capacité de raisonner de manière rigoureuse ou d’expliquer leurs décisions », écrit DeepMind. Pour surmonter cette difficulté, DeepMind a associé un modèle de langage à un moteur de déduction symbolique plus traditionnel qui effectue un raisonnement algébrique et géométrique.

La recherche a été dirigée par Trieu Trinh, un informaticien qui a récemment obtenu son doctorat à l’Université de New York. Il a été résident à DeepMind entre 2021 et 2023.

Evan Chen, ancien médaillé d’or aux Olympiades qui a évalué une partie des résultats d’AlphaGeometry, l’a qualifié d’« impressionnant car il est à la fois vérifiable et propre ». Alors que certains logiciels antérieurs généraient des preuves géométriques complexes difficiles à comprendre pour les examinateurs humains, le résultat d’AlphaGeometry est similaire à ce qu’écrirait un mathématicien humain.

AlphaGeometry fait partie du projet plus vaste de DeepMind visant à améliorer les capacités de raisonnement des grands modèles de langage en les combinant avec des algorithmes de recherche traditionnels. DeepMind a publié plusieurs articles dans ce domaine au cours de la dernière année.

Comment fonctionne AlphaGeometry

Commençons par un exemple simple présenté dans l’article AlphaGeometry, publié mercredi par Nature :

Le but est de prouver que si un triangle a deux côtés égaux (AB et AC), alors les angles opposés à ces côtés seront également égaux. Nous pouvons le faire en créant un nouveau point D au milieu du troisième côté du triangle (BC). Il est facile de montrer que les trois côtés du triangle ABD ont la même longueur que les côtés correspondants du triangle ACD. Et deux triangles de côtés égaux ont toujours des angles égaux.

Les problèmes de géométrie de l’OMI sont beaucoup plus complexes que ce problème de jouet, mais fondamentalement, ils ont la même structure. Ils commencent tous par une figure géométrique et quelques faits sur la figure comme « le côté AB a la même longueur que le côté AC ». L’objectif est de générer une séquence d’inférences valides qui se terminent par une déclaration donnée telle que « l’angle ABC est égal à l’angle BCA ».

Depuis de nombreuses années, nous disposons de logiciels capables de générer des listes de conclusions valides pouvant être tirées d’un ensemble d’hypothèses de départ. Les problèmes de géométrie simples peuvent être résolus par la « force brute » : énumérer mécaniquement tous les faits possibles qui peuvent être déduits de l’hypothèse donnée, puis énumérer toutes les inférences possibles à partir de ces faits, et ainsi de suite jusqu’à ce que vous arriviez à la conclusion souhaitée.

Mais ce type de recherche par force brute n’est pas réalisable pour un problème de géométrie au niveau de l’OMI car l’espace de recherche est trop grand. Non seulement les problèmes plus difficiles nécessitent des preuves plus longues, mais les preuves sophistiquées nécessitent souvent l’introduction de nouveaux éléments dans la figure initiale, comme pour le point D de la preuve ci-dessus. Une fois que l’on prend en compte ce genre de « points auxiliaires », l’espace des preuves possibles explose et les méthodes de force brute deviennent peu pratiques.

Source-147