Lors du GTC 2023, Nvidia a annoncé sa nouvelle bibliothèque logicielle cuLitho pour accélérer un goulot d’étranglement critique dans le flux de travail de fabrication de semi-conducteurs. La nouvelle bibliothèque accélère la lithographie computationnelle, une technique utilisée pour créer des photomasques pour la production de puces. Nvidia affirme que sa nouvelle approche permet à 500 systèmes DGX H100 équipés de 4 000 GPU Hopper d’effectuer la même quantité de travail que 40 000 serveurs basés sur CPU, mais le font 40 fois plus rapidement et avec 9 fois moins de puissance. Nvidia affirme que cela réduit la charge de travail de lithographie informatique pour produire un photomasque de plusieurs semaines à une opération de huit heures.
Les leaders de la fabrication de puces TSMC, ASML et Synopsys ont tous signé pour la nouvelle technologie, Synopys l’intégrant déjà dans ses outils de conception de logiciels. Au fil du temps, Nvidia s’attend à ce que la nouvelle approche permette une densité et un rendement de puces plus élevés, de meilleures règles de conception et une lithographie alimentée par l’IA.
Les scientifiques de Nvidia ont créé de nouveaux algorithmes qui permettent à des flux de travail de lithographie computationnelle de plus en plus complexes de s’exécuter sur des GPU en parallèle, présentant une accélération 40X à l’aide de GPU Hopper. Les nouveaux algorithmes sont intégrés dans une nouvelle bibliothèque d’accélération cuLitho qui peut être intégrée dans les logiciels des fabricants de masques (généralement une fonderie ou un concepteur de puces). La bibliothèque d’accélération cuLitho est également compatible avec les GPU Ampere et Volta, bien que Hopper soit la solution la plus rapide.
L’impression des petites caractéristiques sur une puce commence par un morceau de quartz appelé photomasque. Ce quartz transparent a un motif imprimé d’une conception de puce et fonctionne un peu comme un pochoir – faire briller une lumière à travers le masque grave la conception sur la plaquette, créant ainsi les milliards de transistors 3D et de structures de fil qui composent une puce moderne. Chaque conception de puce nécessite plusieurs expositions pour construire la conception de la puce en couches. En tant que tel, le nombre de photomasques utilisés pendant le processus de fabrication de puces varie en fonction de la puce ; il peut même dépasser 100 masques. Par exemple, Nvidia dit qu’il faut 89 masques pour créer le H100, et Intel cite les masques « 50+ » utilisés pour ses puces 14 nm, par exemple.
De nouvelles techniques sont apparues qui permettent désormais de graver des motifs plus petits que la longueur d’onde de la lumière utilisée pour les créer. Cependant, le rétrécissement continu des caractéristiques a entraîné des problèmes de diffraction, qui « brouillent » essentiellement le dessin qui est imprimé sur le silicium. Le domaine de la lithographie computationnelle contrecarre l’impact de la diffraction grâce à des opérations mathématiques complexes qui optimisent la disposition du masque. Cependant, cette tâche devient de plus en plus gourmande en calcul à mesure que les fonctionnalités se réduisent encore plus, permettant ainsi des milliards de transistors supplémentaires par conception.
Ces problèmes complexes nécessitent de grands clusters d’ordinateurs, comptant souvent des dizaines de milliers de serveurs (Nvidia cite 40 000), qui traitent les chiffres en parallèle sur les processeurs dans une charge de travail qui peut prendre jusqu’à des semaines pour traiter un seul photomasque (le temps varie en fonction de la complexité de la puce – Intel dit qu’il faut cinq jours à son équipe pour créer un seul masque).
Nvidia soutient que le nombre de serveurs nécessaires pour concevoir un masque moderne augmente au même rythme que la loi de Moore, poussant ainsi les exigences du serveur et la quantité d’énergie nécessaire pour les faire fonctionner dans un territoire insoutenable. En fait, les exigences de calcul incroyables pour les nouvelles technologies de masque, comme la technologie de lithographie inverse (ILT) qui utilise des masques curvilignes inverses (ILM), ont déjà entravé l’adoption de ces techniques plus avancées. De plus, High-NA EUV et ILT devraient augmenter de 10 fois la quantité de traitement de données pour les masques dans les années à venir.
C’est là qu’intervient le cuLitho de Nvidia, réduisant la charge de travail de lithographie informatique à huit heures. La bibliothèque cuLitho peut être intégrée dans un logiciel de lithographie computationnelle qui exploite les techniques ILT (formes curvilignes) ou Optical Proximity Correction (OCP, qui utilise des formes « Manhattan »), et est déjà intégrée dans les outils de Synopsys. TSMC et ASML adoptent également la technologie. Compte tenu de la sensibilité de ces types de logiciels, les contrôles américains à l’exportation régiront toute distribution du logiciel vers la Chine et d’autres régions soumises à des sanctions.
Intel utilise depuis longtemps ses propres outils logiciels propriétaires, mais s’oriente lentement vers l’adoption d’outils standard de l’industrie, en particulier lorsqu’il commence à mettre en œuvre ses propres opérations de fonderie IDM 2.0 externes. En tant que tel, il reste à voir si d’autres grandes usines, comme Intel et Samsung, adopteront le nouveau logiciel pour leurs propres outils internes. Quoi qu’il en soit, le support de Synopsys, ASML et TSMC assure une large adoption de la bibliothèque cuLitho et des solutions basées sur GPU de Nvidia avec les principaux fabricants de semi-conducteurs au cours des années à venir.