Tachyum soumet une offre pour construire 20 supercalculateurs exaflops

Tachyum a déclaré mardi qu’il avait soumis une offre au ministère de l’Énergie pour construire un supercalculateur de 20 exaflops en 2025. La machine serait basée sur les processeurs Prodigy de nouvelle génération de l’entreprise dotés d’une microarchitecture propriétaire pouvant être utilisée pour différents types de charges de travail. .

Le DoE américain veut qu’un supercalculateur de 20 exaflops avec une consommation d’énergie de 20 MW à 60 MW soit livré d’ici 2025. Le système devrait être installé au Laboratoire national d’Oak Ridge (ORNL) et complétera le système Frontier du laboratoire qui a été mis en ligne plus tôt cette année.

Tachyum ne divulgue pas le matériel qu’il a proposé au DoE, mais dit seulement qu’il a son processeur Prodigy à 128 cœurs aujourd’hui ainsi qu’un processeur Prodigy 2 plus performant dans sa feuille de route, il est donc prudent de dire que d’ici 2025, il sera avoir ce dernier sous la main et il pourrait être en mesure d’adresser le système à venir.

Le Prodigy de Tachyum est un processeur homogène universel contenant jusqu’à 128 cœurs VLIW 64 bits propriétaires qui comportent deux unités vectorielles 1024 bits par cœur et une unité matricielle 4096 bits par cœur. Tachyum attendait son processeur phare Prodigy T16128-AIX (s’ouvre dans un nouvel onglet) pour offrir jusqu’à 90 téraflops FP64 pour HPC ainsi que jusqu’à 12 « pétaflops IA » pour l’inférence et la formation IA (vraisemblablement lors de l’exécution de charges de travail INT8 ou FP8). Prodigy consomme jusqu’à 950W et utilise un refroidissement liquide.

C’était avant que Tachyum ne poursuive Cadence, son fournisseur de propriété intellectuelle, pour les performances inférieures aux attentes de son processeur Prodigy. Nous n’avons aucune idée des attentes actuelles en matière de performances pour la puce.

En théorie, Tachyum pourrait alimenter un système exaflopique utilisant plus de 11 000 de ses processeurs Prodigy, même si la consommation électrique d’une telle machine serait gargantuesque. Vraisemblablement, Prodigy 2 a une meilleure chance de répondre aux besoins d’un système exascale de nouvelle génération que le Prodigy original.

Il existe actuellement un supercalculateur de classe exaflops aux États-Unis, le système Frontier 1.1 exaflops du Oak Ridge National Laboratory (ORNL) qui est basé sur les processeurs EPYC à 64 cœurs d’AMD ainsi que sur les GPU de calcul Instinct MI250X. Deux autres systèmes exaflopiques sont en cours de construction aux États-Unis, la machine Aurora à 2 exaflops alimentée par les processeurs évolutifs Xeon de 4e génération d’Intel et les GPU de calcul Xe-HPC (alias Ponte Vecchio) ainsi que le supercalculateur El Capitan « > 2 exaflops » basé sur Processeurs EPYC à architecture Zen 4 d’AMD et GPU Instinct MI300.

L’un des aspects intéressants des plans de supercalcul du DoE est qu’il souhaite désormais mettre à niveau ses capacités de calcul hautes performances tous les 12 à 24 mois, et non tous les 4 à 5 ans. En conséquence, le DoE sera plus désireux d’adopter des architectures exotiques comme Tachyum’s Prodigy qu’il ne l’est aujourd’hui.

« Nous souhaitons également explorer le développement d’une approche qui s’éloigne des acquisitions monolithiques vers un modèle permettant des cycles de mise à niveau plus rapides des systèmes déployés, pour permettre une innovation plus rapide sur le matériel et les logiciels », lit-on dans un document du DoE. « Une stratégie possible comprendrait une réutilisation accrue de l’infrastructure existante afin que les mises à niveau soient modulaires. Un objectif serait de réinventer l’architecture des systèmes et un processus d’acquisition efficace qui permette l’injection continue d’avancées technologiques dans une installation (par exemple, tous les 12 à 24 mois plutôt que tous les 4 à 5 ans). Comprendre les compromis de ces approches est l’un des objectifs de cette RFI, et nous invitons les réponses à inclure les avantages et/ou les inconvénients perçus de cette approche de mise à niveau modulaire. »

L’un des avantages de Tachyum’s Prodigy par rapport aux processeurs et GPU traditionnels pour les charges de travail AI et HPC est qu’il est adapté aux deux types de charges de travail, c’est pourquoi Prodigy peut être utilisé pour les charges de travail AI lorsque ses capacités HPC ne sont pas utilisées et vice versa. Le DoE peut ou non adopter Tachyum pour l’un de ses prochains supercalculateurs, mais la société espère obtenir un contrat approprié.

Source-138