Hewlett Packard Enterprise (HPE) a annoncé la construction d’un nouveau supercalculateur IA puissant en collaboration avec Cerebras Systems, fabricant de la plus grande puce au monde.
Le nouveau système sera composé d’une combinaison de HPE Superdome Flex les serveurs et les accélérateurs Cerebras CS-2, qui sont alimentés par le monstrueux processeur Wafer-Scale Engine 2 (WSE-2).
Le supercalculateur sans nom devrait être mis en service plus tard cet été au Leibniz Supercomputing Center (LRZ) en Bavière, offrant aux chercheurs une nouvelle ressource pour aider à accélérer les projets de recherche sur des sujets allant de l’imagerie médicale à l’ingénierie aérospatiale.
Nouveau supercalculateur IA
Dévoilé par Cerebras en avril de l’année dernière, le WS2-E est conçu expressément pour accélérer les charges de travail de formation et d’inférence de l’IA. La puce abrite 2,6 billions de transistors et 850 000 cœurs d’IA répartis sur 46 225 mm (2) de silicium, censés fournir les performances d’IA de centaines de GPU.
La puce de la taille d’une tranche dispose également de 40 Go de mémoire sur puce et de 20 Po/s de bande passante mémoire, ce qui permet de conserver simultanément tous les paramètres des modèles d’IA à grande échelle sur la puce, ce qui accélère le calcul.
Le lancement du nouveau système en Allemagne marquera la première fois que la puce WSE-2 sera déployée à l’intérieur d’un supercalculateur européen.
« Nous avons fondé Cerebras pour révolutionner le calcul », a expliqué Andrew Feldman, PDG et cofondateur de Cerebras Systems. « Nous sommes fiers de nous associer à LRZ et HPE pour donner aux chercheurs de Bavière l’accès à une IA ultra-rapide, leur permettant d’essayer de nouvelles hypothèses, de former de grands modèles de langage et, finalement, de faire avancer la découverte scientifique. »
L’arrivée du nouveau système a également été célébrée par les chercheurs du LRZ, qui affirment que la machine augmentera considérablement la vitesse à laquelle ils pourront effectuer d’importantes charges de travail d’IA et de HPC à usage général.
« Actuellement, nous observons que la demande de calcul d’IA double tous les trois à quatre mois avec nos utilisateurs », a déclaré le professeur Dr. Dieter Kranzlmüller, directeur du LRZ.
« Grâce à la forte intégration des processeurs, de la mémoire et des réseaux embarqués sur une seule puce, Cerebras permet des performances et une vitesse élevées. Cela promet beaucoup plus d’efficacité dans le traitement des données et donc une percée plus rapide des découvertes scientifiques.