Un modérateur des forums Intel a confirmé que les GPU Arc Alchemist d’Intel, axés sur le consommateur, ne comporteront pas de cœurs FP64 à accélération matérielle, reléguant les GPU à la prise en charge native des FP32 et FP16. La seule exception à cela est le support FP64 émulé sur Arc Alchemist qui sera supporté pour les cas de niche. Cependant, en raison de la nature de l’émulation, les calculs FP64 sur Arc s’exécuteront beaucoup plus lentement que sur les GPU dotés de cœurs FP64 à accélération matérielle native.
Gardez à l’esprit que cette configuration ne s’applique qu’aux GPU Arc Alchemist d’Intel centrés sur le jeu, et non à ses prochains GPU Ponte Vecchio pour l’espace d’entreprise.
FP64 est un format de numéro d’ordinateur couramment utilisé dans les applications de calcul haute performance (HPC). De plus, le grand format s’est avéré avantageux dans des applications mathématiques très complexes, telles que la physique, les prévisions météorologiques et les simulations de toutes sortes, grâce à la large plage dynamique de valeurs numériques fournie par FP64.
Cependant, FP64 n’est vraiment bénéfique que dans le domaine de l’entreprise et est rarement devenu utile dans l’espace grand public. En termes simples, FP64 fournit une telle quantité de valeurs numériques qu’il est trop grand pour être traité pour des calculs plus petits, effectués dans des charges de travail telles que les jeux 3D. En général, des calculs plus petits peuvent être effectués plus rapidement sur des cœurs dotés de capacités FP32 et même FP16. C’est pourquoi vous voyez des GPU de jeu axés sur le consommateur donner la priorité aux performances FP32 et FP16 par rapport à FP64.
Par exemple, si nous jetons un coup d’œil à la GeForce RTX 3090 dotée de la dernière architecture Ampère de Nvidia, vous constaterez que ses performances FP32 atteignent un impressionnant 35,58 téraflops. Mais les capacités de calcul FP64 du RTX 3090 sont pâles par rapport à cette métrique de performance, atteignant seulement 556 Gigaflops (pas même un seul téraflop) – ou juste 64e des performances des capacités FP32 du GPU.
Cela montre à quel point le FP64 est peu impressionnant dans l’espace grand public. Dans le monde réel, ce type de performances FP64 n’est bénéfique que pour les démos ou les benchmarks FP64 et rarement rien de plus.
Dans cet esprit, il semble que la stratégie d’Intel consistant à nier complètement tout support FP64 accéléré par le matériel sur Arc Alchemist pourrait être une bonne chose. L’absence de cœurs FP64 « inutiles » donne à Intel plus de place sur les matrices GPU pour ajouter du matériel important, comme plus de cœurs FP32 ou FP16, des encodeurs et décodeurs matériels supplémentaires ou des caches plus grands.