Le prochain supercalculateur DGX de NVIDIA est entièrement dédié à l’IA générative

Le PDG Jensen Hiang a fait une série d’annonces lors de son discours d’ouverture sur Computex, y compris des détails sur le prochain supercalculateur DGX de la société. Étant donné où l’industrie se dirige clairement, il ne faut pas s’étonner que le DGX GH200 vise en grande partie à aider les entreprises à développer des modèles.

Le supercalculateur utilise un nouveau système de commutation NVLink pour permettre à 256 superpuces GH200 Grace Hopper d’agir comme un seul GPU (chacune des puces a un processeur Grace basé sur Arm et un GPU H100 Tensor Core). Cela, selon NVIDIA, permet au DGX GH200 de délivrer 1 exaflop de performances et d’avoir 144 téraoctets de mémoire partagée. La société affirme que c’est près de 500 fois plus de mémoire que vous ne trouveriez dans un seul système DGX A100.

A titre de comparaison, le des supercalculateurs du Top500 est le seul système exascale connu, ayant atteint une performance de près de 1,2 exaflops sur le benchmark Linmark. C’est plus de deux fois la performance de pointe du système de deuxième place, le Japon.

En effet, NVIDIA prétend avoir développé un supercalculateur qui peut se tenir aux côtés du système connu le plus puissant de la planète (Meta en construit un qui, selon lui, sera le supercalculateur IA le plus rapide au monde une fois qu’il sera entièrement construit). NVIDIA affirme que l’architecture du DGX GH200 offre 10 fois plus de bande passante que la génération précédente, « fournissant la puissance d’un supercalculateur IA massif avec la simplicité de programmation d’un seul GPU ».

Certains grands noms s’intéressent au DGX GH200. Google Cloud, Meta et Microsoft devraient être parmi les premières entreprises à accéder au supercalculateur pour tester comment il peut gérer les charges de travail génératives de l’IA. NVIDIA indique que les supercalculateurs DGX GH200 devraient être disponibles d’ici la fin de 2023.

La société construit également son propre supercalculateur, Helios, qui combine quatre systèmes DGX GH200. NVIDIA s’attend à ce que Helios soit en ligne d’ici la fin de l’année.

Huang a discuté d’autres développements de l’IA générative lors de son discours, dont un sur le front des jeux. NVIDIA Avatar Cloud Engine (ACE) for Games est un service auquel les développeurs pourront puiser afin de créer des modèles d’IA personnalisés pour la parole, la conversation et l’animation. NVIDIA affirme que ACE for Games peut « donner aux personnages non jouables des compétences conversationnelles afin qu’ils puissent répondre aux questions avec des personnalités réalistes qui évoluent ».

Source-145