Tesla s’apprête à lancer lundi son très attendu supercalculateur, selon @SawyerMerritt. La machine sera utilisée pour diverses applications d’intelligence artificielle (IA), mais le cluster est si puissant qu’il pourrait également être utilisé pour des charges de travail exigeantes de calcul haute performance (HPC). En fait, le supercalculateur basé sur Nvidia H100 sera l’une des machines les plus puissantes au monde.
Le nouveau cluster de Tesla utilisera 10 000 GPU de calcul Nvidia H100, qui offriront des performances maximales de 340 FP64 PFLOPS pour le calcul technique et de 39,58 INT8 ExaFLOPS pour les applications d’IA. En fait, les 340 FP64 PFLOPS de Tesla sont supérieurs aux 309 FP64 PFLOPS proposés par Lumi, le troisième supercalculateur le plus performant au monde.
Avec son nouveau supercalculateur, Tesla améliore considérablement ses capacités informatiques pour entraîner sa technologie de conduite entièrement autonome (FSD) plus rapidement que jamais. Cela pourrait non seulement rendre Tesla plus compétitif que les autres constructeurs automobiles, mais aussi faire de l’entreprise le propriétaire de l’un des superordinateurs les plus rapides au monde.
« Grâce à la formation vidéo dans le monde réel, nous pouvons disposer des plus grands ensembles de données de formation au monde, avec une capacité de cache de niveau chaud supérieure à 200 Po, soit des ordres de grandeur supérieurs à ceux des LLM. » expliqué Tim Zaman, responsable de l’ingénierie AI Infra et AI Platform chez Tesla.
Alors que le nouveau cluster basé sur le H100 devrait améliorer considérablement la vitesse de formation de Tesla, Nvidia a du mal à répondre à la demande pour ces GPU. En conséquence, Tesla investit plus d’un milliard de dollars pour développer son propre superordinateur, Dojo, construit sur un système sur puce conçu sur mesure et hautement optimisé.
Dojo accélérera non seulement la formation FSD, mais gérera également le traitement des données pour l’ensemble du parc de véhicules Tesla. Tesla met simultanément en ligne son cluster GPU Nvidia H100 avec Dojo, une décision qui donnera à l’entreprise une puissance de calcul inégalée dans l’industrie automobile.
Elon Musk a récemment révélé que Tesla prévoyait de dépenser plus de 2 milliards de dollars pour la formation en IA en 2023 et 2 milliards de dollars supplémentaires en 2024, spécifiquement pour l’informatique pour la formation FSD. Cela souligne l’engagement de Tesla à surmonter les goulots d’étranglement informatiques et devrait offrir des avantages substantiels par rapport à ses concurrents.