L’unité vectorielle RISC-V récemment révélée pourrait être utilisée pour les applications AI, HPC et GPU

Semidynamics a introduit l’une des premières unités vectorielles RISC-V de l’industrie qui pourrait être utilisée pour les processeurs hautement parallèles, tels que ceux utilisés pour l’intelligence artificielle (IA), le calcul haute performance (HPC) et même le traitement graphique s’il est équipé d’un processeur spécial approprié. à des fins IP. Cette annonce marque une étape importante dans le développement de l’écosystème RISC-V.

L’unité vectorielle de Semidynamics est entièrement compatible avec la spécification vectorielle RISC-V 1.0 et offre une pléthore de fonctionnalités supplémentaires adaptables qui améliorent ses capacités de traitement de données. Le VU est composé de plusieurs « cœurs vectoriels », qui sont comparables aux cœurs GPU d’AMD, d’Intel et de Nvidia, et sont conçus pour exécuter plusieurs calculs simultanément. Chaque cœur de vecteur est équipé d’unités arithmétiques capables d’effectuer des opérations telles que l’addition, la soustraction, la multiplication-addition fusionnée, la division, la racine carrée et les opérations logiques.

Le noyau vectoriel développé par Semidynamics peut être personnalisé pour prendre en charge divers types de données, notamment FP64, FP32, FP16, BF16, INT64, INT32, INT16 ou INT8, selon les besoins spécifiques de l’application du client. Les clients peuvent également choisir le nombre de cœurs vectoriels à incorporer dans l’unité vectorielle, avec des options de 4, 8, 16 ou 32 cœurs, offrant un large éventail de possibilités de compromis entre puissance et performance.

(Crédit image : Semidynamics)

L’unité vectorielle de Semidynamics dispose d’un réseau haut débit qui connecte tous les cœurs vectoriels, facilitant le brassage des données pour des instructions RISC-V spécifiques. De manière unique, Semidynamics permet la personnalisation de la taille de bit du registre vectoriel (VLEN), offrant des rapports 2X, 4X et 8X en plus du 1X standard. Lorsque VLEN est supérieur à la largeur totale du chemin de données (DLEN), les opérations vectorielles prennent plusieurs cycles, ce qui peut aider à gérer les latences de la mémoire et à réduire la consommation d’énergie.

Source-138