Étant l’un des membres fondateurs de l’Alliance for Open Media, Intel a beaucoup fait pour promouvoir le codec AV1 et le rendre plus accessible aux créateurs/fournisseurs de contenu et aux utilisateurs finaux. Intel a été le premier à proposer le décodage AV1 matériel avec ses GPU Xe-LP en 2020. Cette semaine, il a publié la version 1.0 de son encodeur et décodeur AV1 à technologie vidéo évolutive open source rapide pour les processeurs. SVT-AV1 fonctionne avec tous les processeurs modernes.
Le codec vidéo open source AV1 a été conçu pour des résolutions ultra-haute définition, une large gamme de couleurs et des améliorations de plage dynamique élevée. AOMedia a déclaré en 2018 que son AV1 était 30 % plus efficace que les codecs existants (impliquant principalement H.265/HEVC qui est conçu pour un contenu 4K+ similaire), ce qui est un gros problème. Mais un problème avec les codecs très efficaces est qu’ils sont extrêmement gourmands en ressources et nécessitent généralement une accélération matérielle pour fonctionner correctement. Pendant ce temps, les processeurs modernes ont beaucoup de ressources et de nouvelles instructions qui peuvent être appliquées au décodage et à l’encodage, ce qui est précisément ce que fait SVT-AV1.
SVT-AV1 est une bibliothèque d’encodeurs/décodeurs évolutive et indépendante des normes qui peut tirer parti de la nature multicœur des processeurs modernes et des instructions AVX2. Le SVT-AV1 ajoute également d’autres optimisations AVX2 pour améliorer les performances, les améliorations de la qualité d’image, le décodage rapide pour plus de niveaux prédéfinis et la prise en charge des images S, rapporte Phoronix.
Les bibliothèques SVT-AV1 d’Intel sont prises en charge sur les machines x86 modernes (Intel 5th Generation Core ‘Broadwell’ et supérieur) exécutant macOS d’Apple, Windows de Microsoft et Linux.
Intel et Netflix ont initialement lancé le projet SVT-AV1 pour développer un encodeur AV1 de qualité production avec des niveaux de performances applicables à diverses applications, de la vidéo à la demande premium à l’encodage/transcodage en temps réel et en direct. En août 2020, la bibliothèque de codage/décodage SVT-AV1 a été adoptée par le groupe de travail sur la mise en œuvre logicielle (SIWG) d’AOMedia pour rendre AV1 plus populaire. La version 1.0 de SVT-AV1 marque une étape importante dans le développement des bibliothèques d’encodeurs/décodeurs.
La version 1.0 des bibliothèques d’encodeurs/décodeurs SVT-AV1 est une étape importante et une bonne nouvelle pour les créateurs de contenu et les utilisateurs finaux. Cependant, pour des entreprises comme Netflix, Intel propose désormais des accélérateurs Arctic Sound-M basés sur le silicium DG2 qui peuvent gérer huit flux 4K simultanés et prennent en charge l’encodage et le décodage AV1 accélérés par le matériel.
L’Intel Arctic Sound 1T à tuile unique comprend un GPU Xe-HP avec 384 EU et 16 Go de mémoire HBM2E, offrant une bande passante maximale allant jusqu’à 716 Go / s (ce qui signifie probablement que nous avons affaire à deux piles de HBM2E qui utilisent un interface 2048 bits). L’accélérateur est une petite carte pleine hauteur à un seul emplacement conçue pour un TDP de 150 W.
La carte Arctic Sound 2T d’Intel embarque un GPU Xe-HP avec deux tuiles, 960 EU (480 × 2 pour être plus précis) et 32 Go de DRAM HBM2E. L’accélérateur utilise un facteur de forme pleine longueur, pleine hauteur (FLFH) et est conçu pour un TDP de 300 W fourni à l’aide d’un connecteur d’alimentation à huit broches. (Une chose à garder à l’esprit est qu’IgorsLab a édité les images des cartes pour protéger la source.)
L’architecture Xe-HP d’Intel est bien loin de l’architecture Xe-LP de la société que nous connaissons grâce aux GPU grand public Iris Xe. La carte Xe-HP prend en charge davantage de formats à virgule flottante (par exemple, FP16, FP32, FP64 à usage général, format bfloat16 pour l’informatique AI/ML), des instructions plus spécifiques au calcul, des instructions de convolution DP4A pour l’apprentissage en profondeur et les extensions XMX d’Intel.
Les GPU Xe-HP orientés centre de données utilisent de toutes nouvelles unités d’exécution (EU) avec diverses améliorations IPC, prennent en charge la mémoire HBM2E et sont fabriqués à l’aide de la technologie de processus SuperFin 10 nm optimisée par Intel. Bref, le Xe-HP n’est pas le Xe-LP ou le Xe-HPG sous stéroïdes, mais quelque chose de complètement différent.
Intel permet désormais à certains de ses clients de prévisualiser ses cartes de calcul Arctic Sound intégrant des implémentations Xe-HP à une ou deux tuiles. Intel a annoncé l’année dernière une implémentation Xe-HP à quatre tuiles et a même démontré l’un de ces accélérateurs en action offrant plus de 42 FP32 TFLOPS de performances. Cependant, l’entreprise n’est pas prête à l’échantillonner pour le moment ou ne l’échantillonne qu’avec certains clients.
Les plans Xe-HP d’Intel ne sont pas complètement clairs car la société ne les a jamais détaillés. Pendant ce temps, le nombre d’UE de ces deux cartes est un peu plus faible que prévu (en supposant qu’une tuile Xe-HP comporte 512 UE). En attendant, nous n’avons aucune idée de l’âge de ces cartes et des configurations qu’Intel prévoit d’expédier.