Le scientifique en chef de Nvidia a récemment expliqué comment ses équipes de R&D utilisent les GPU pour accélérer et améliorer la conception de nouveaux GPU. Quatre processus complexes et traditionnellement lents ont déjà été optimisés en tirant parti des techniques d’apprentissage automatique (ML) et d’intelligence artificielle (IA). Dans un exemple, l’utilisation de l’inférence accélérée AI/ML peut accélérer une tâche de conception de GPU itérative courante de trois heures à trois secondes.
Bill Dally est scientifique en chef et SVP de la recherche chez Nvidia. HPC Wire a rassemblé une version condensée d’une conférence que Dally a partagée lors de la récente conférence GTC, dans laquelle il discute du développement et de l’utilisation d’outils d’IA pour améliorer et accélérer la conception de GPU. Dally supervise environ 300 personnes, et ces gens intelligents travaillent généralement dans les groupes de recherche décrits ci-dessous.
Dans son discours, Dally a décrit quatre domaines importants de la conception de GPU où l’IA/ML peut être exploitée à bon escient : cartographier les chutes de tension, prédire les parasites, les problèmes de placement et de routage et automatiser la migration cellulaire standard. Jetons un coup d’œil à chaque processus et à la façon dont les outils d’IA aident la R&D de Nvidia à se concentrer sur le travail cérébral au lieu d’attendre que les ordinateurs fassent leur travail.
La cartographie des chutes de tension montre aux concepteurs où la puissance est utilisée dans les nouvelles conceptions de GPU. L’utilisation d’un outil de CAO conventionnel vous aidera à calculer ces chiffres en environ trois heures, explique Dally. Cependant, une fois formé, l’outil AI de Nvidia peut réduire ce processus à trois secondes. Une telle réduction du temps de traitement aide beaucoup avec un processus comme celui-ci, qui est de nature itérative. Le processus, tel qu’il est, offre une précision de 94%, ce qui est le compromis pour l’énorme augmentation de la vitesse itérative.
Prédire les parasites à l’aide de l’IA est particulièrement agréable pour Dally. Il dit qu’il a passé pas mal de temps en tant que concepteur de circuits et que ce nouveau modèle d’IA réduit un long processus multi-personnel et multi-compétences. Encore une fois, l’erreur de simulation est raisonnablement faible, à <10 % dans ce cas. La réduction de ces processus itératifs traditionnellement longs peut libérer un concepteur de circuits pour qu'il soit plus créatif ou aventureux.
Les défis de localisation et de routage sont importants pour la conception de puces, car ils ressemblent à la planification de routes à travers une agglomération très fréquentée. Une erreur entraînera des embouteillages de trafic (données), nécessitant un réacheminement ou une replanification des mises en page pour plus d’efficacité. L’utilisation des réseaux de neurones graphiques (GNN) pour analyser ce problème dans la conception des puces permet de mettre en évidence les domaines de préoccupation et d’agir sur les problèmes de manière intelligente.
Enfin, l’automatisation de la migration cellulaire standard à l’aide de l’IA est un autre outil très utile de la boîte à outils de conception de puces de Nvidia. Dally parle du grand effort précédemment requis pour migrer une conception de puce de sept à cinq nanomètres, par exemple. En utilisant des IA d’apprentissage par renforcement, « 92 % de la bibliothèque de cellules a pu être réalisée par cet outil sans règle de conception ni erreur de règle électrique », dit-il. Ceci est bienvenu pour ses énormes économies de main-d’œuvre « et dans de nombreux cas, nous nous retrouvons également avec une meilleure conception », poursuit Dally.
L’année dernière au GTC, le discours de Dally a souligné l’importance de donner la priorité à l’IA et a parlé des cinq laboratoires Nvidia distincts se livrant à des projets de recherche sur l’IA. Nous avons hâte de voir et d’entendre si les outils d’IA maison de Nvidia ont été importants pour la conception des GPU Ada Lovelace et pour les préparer pour TSMC 5nm. Dally semble laisser entendre que l’automatisation de la migration cellulaire standard à l’aide de l’IA a été utilisée récemment dans certaines transitions de 7 nm à 5 nm.