Il est souvent facile d’oublier que GPU signifie Graphics Processing Unit, mais lors des sessions chargées de la GTC 2023 (GPU Technology Conference) d’hier, Nvidia a annoncé pas moins de quatre nouveaux processeurs (le propre mot de l’entreprise) alors qu’il cherche à consolider sa position de Champion du matériel d’IA avec pratiquement aucune compétition en vue.
Le succès extraordinaire de ChatGPT a contribué à façonner le récit, stimulant la demande de plates-formes informatiques d’inférence plus grandes, meilleures, plus grandes et plus puissantes.
« Le nombre d’applications pour l’IA générative est infini, limité uniquement par l’imagination humaine. Armer les développeurs de la plate-forme informatique d’inférence la plus puissante et la plus flexible accélérera la création de nouveaux services qui amélioreront nos vies d’une manière encore inimaginable. a déclaré Jensen Huang, fondateur et PDG de NVIDIA.
Étant donné que Nvidia a un nombre beaucoup plus restreint de clients à desservir, elle peut fournir des produits affinés pour des tâches spécifiques. Le nouveau L4 pour la vidéo AI est 120 fois plus puissant en termes de performances vidéo que les processeurs, tandis que le L40 pour la génération d’images est 7 fois meilleur en inférence pour la diffusion stable que la génération précédente.
Le H100 NVL a été conçu pour faire face à des déploiements massifs de LLM (Large Language Model) avec un énorme 94 Go de mémoire, l’aidant à fournir des performances d’inférence 12 fois plus rapides sur le ChatGPT3 déjà obsolète (et par rapport à la génération A100 précédente). Le dernier sur la liste est la superpuce Nvidia Grace Hopper pour les modèles de recommandation qui rapproche le CPU et le GPU basés sur Arm de Nvidia et est attendu plus tard cette année.
Qu’en est-il d’Intel et d’AMD ?
Depuis 40 ans, le CPU (Central Processing Unit) est au cœur de l’informatique mais on assiste – en direct – à un coup de leadership. Nvidia à lui seul a fait pencher la balance du pouvoir; Intel a été le plus grand perdant avec son cours de bourse divisé par deux depuis l’année dernière tandis qu’AMD continue de jouer le deuxième violon au pays du GPU (moins en ce qui concerne le CPU).
Le CPU a toujours été en danger d’être supplanté en raison de sa nature générique ; c’est un touche-à-tout après tout. Le GPU (et d’autres unités de traitement plus exotiques) a tiré parti de sa capacité à rapprocher le matériel et les logiciels (via l’API CUDA de Nvidia par exemple) pour exceller dans les charges de travail spécialisées.
L’impact durable de Nvidia est illustré par un nouveau service appelé cuLitho (abréviation de lithographie computationnelle) où il a collaboré avec ASML, TSMC et Synopsys pour aider à concevoir et fabriquer la prochaine génération de puces, qu’il s’agisse de CPU, GPU, NAND ou de tout autre produit à base de silicium. Ici, nous avons des GPU accélérant le développement de la prochaine génération de GPU avec Nvidia prédisant une amélioration des performances de 40x par rapport au CPU.
Avec une capitalisation boursière de près de 640 milliards de dollars, Nvidia vaut plus que Qualcomm (137 milliards de dollars), Intel (117 milliards de dollars), AMD (153 milliards de dollars) et Arm (est. 50 milliards de dollars) réunis. Avec Nvidia ayant apparemment construit une avance insurmontable dans le matériel d’IA, toutes les chances sont faibles quant à qui sera le deuxième meilleur.