Le MIT a résolu une équation différentielle vieille d’un siècle pour briser le goulot d’étranglement informatique de l’IA « liquide »

L’année dernière, le MIT a développé un algorithme AI/ML capable d’apprendre et de s’adapter à de nouvelles informations pendant le travail, et pas seulement pendant sa phase de formation initiale. Ces réseaux de neurones «liquides» (au sens de Bruce Lee) jouent littéralement aux échecs 4D – leurs modèles nécessitant des données de séries chronologiques pour fonctionner – ce qui les rend idéaux pour une utilisation dans des tâches sensibles au temps comme la surveillance des stimulateurs cardiaques, les prévisions météorologiques, les prévisions d’investissement ou navigation des véhicules autonomes. Mais le problème est que le débit de données est devenu un goulot d’étranglement et que la mise à l’échelle de ces systèmes est devenue d’un coût prohibitif, en termes de calcul.

Mardi, des chercheurs du MIT ont annoncé qu’ils avaient mis au point une solution à cette restriction, non pas en élargissant le pipeline de données, mais en résolvant une équation différentielle qui a déconcerté les mathématiciens depuis 1907. Plus précisément, l’équipe a résolu, « l’équation différentielle derrière l’interaction de deux neurones à travers les synapses… pour débloquer un nouveau type d’algorithmes d’intelligence artificielle rapides et efficaces.

« Les nouveaux modèles d’apprentissage automatique que nous appelons » CfC  » [closed-form Continuous-time] remplacer l’équation différentielle définissant le calcul du neurone par une approximation de forme fermée, préservant les belles propriétés des réseaux liquides sans avoir besoin d’intégration numérique », a déclaré la professeure du MIT et directrice du CSAIL, Daniela Rus, dans un communiqué de presse mardi. « Les modèles CfC sont causals, compacts, explicables et efficaces pour former et prédire. Ils ouvrent la voie à un apprentissage automatique fiable pour les applications critiques pour la sécurité. »

Ainsi, pour ceux d’entre nous qui n’ont pas de doctorat en mathématiques vraiment difficiles, les équations différentielles sont des formules qui peuvent décrire l’état d’un système à divers points ou étapes discrets tout au long du processus. Par exemple, si vous avez un bras de robot se déplaçant du point A au point B, vous pouvez utiliser une équation différentielle pour savoir où il se situe entre les deux points dans l’espace à n’importe quelle étape donnée du processus. Cependant, la résolution de ces équations pour chaque étape devient rapidement coûteuse en calcul. La solution « forme fermée » du MIT contourne ce problème en modélisant fonctionnellement la description complète d’un système en une seule étape de calcul. Comme l’explique l’équipe du MIT :

Imaginez si vous avez un réseau de neurones de bout en bout qui reçoit les entrées de conduite d’une caméra montée sur une voiture. Le réseau est formé pour générer des sorties, comme l’angle de braquage de la voiture. En 2020, l’équipe a résolu ce problème en utilisant des réseaux de neurones liquides à 19 nœuds, de sorte que 19 neurones plus un petit module de perception pourraient conduire une voiture. Une équation différentielle décrit chaque nœud de ce système. Avec la solution de forme fermée, si vous la remplacez à l’intérieur de ce réseau, cela vous donnera le comportement exact, car c’est une bonne approximation de la dynamique réelle du système. Ils peuvent ainsi résoudre le problème avec un nombre encore plus faible de neurones, ce qui signifie que ce serait plus rapide et moins coûteux en calculs.

En résolvant cette équation au niveau des neurones, l’équipe espère pouvoir construire des modèles du cerveau humain qui mesurent des millions de connexions neuronales, ce qui n’est pas possible aujourd’hui. L’équipe note également que ce modèle CfC pourrait être en mesure de suivre la formation visuelle qu’il a apprise dans un environnement et de l’appliquer à une situation entièrement nouvelle sans travail supplémentaire, ce que l’on appelle la généralisation hors distribution. Ce n’est pas quelque chose que les modèles de la génération actuelle peuvent vraiment faire et cela s’avérerait être une étape importante vers les systèmes d’IA généralisés de demain.

Tous les produits recommandés par Engadget sont sélectionnés par notre équipe éditoriale, indépendante de notre maison mère. Certaines de nos histoires incluent des liens d’affiliation. Si vous achetez quelque chose via l’un de ces liens, nous pouvons gagner une commission d’affiliation. Tous les prix sont corrects au moment de la publication.

Source-145