Biren, un développeur chinois de GPU de calcul, envisage une offre publique initiale (IPO) à Hong Kong cette année. Cela survient alors que les clients nationaux préfèrent de plus en plus ses puces IA à celles de Nvidia, qui sont chères et rares, selon un rapport de Bloomberg. Espérant saisir cette opportunité, la startup technologique se positionne pour capitaliser sur la demande accrue pour ses produits
Biren devrait demander sa première vente d’actions dans les prochaines semaines, selon le rapport qui cite des sources anonymes. Parallèlement, Biren négocie avec des investisseurs potentiels, y compris des fonds soutenus par le gouvernement à Guangzhou. Ces discussions se concentrent sur une autre ronde de financement indépendante qui pourrait rapporter environ 2 milliards de yuans (279 millions de dollars). Biren cherchait à lever des fonds l’année dernière pour une valorisation de 17 milliards de yuans, soit environ 2,4 milliards de dollars. Pour l’instant, Biren n’a pas encore déterminé la portée de l’introduction en bourse, ainsi que le calendrier exact.
La raison pour laquelle Biren est si confiant dans sa valorisation est que les produits de la société semblent compétitifs par rapport aux GPU de calcul de Nvidia (du moins sur le papier) et que le marché des GPU de calcul compatibles avec l’IA est en plein essor ces jours-ci.
La première famille de GPU de calcul de Biren se compose de deux options : le BR100 et le BR104. Le BR104 « de base » offre des performances jusqu’à 128 FP32 TFLOPS ou 1 INT8 PetaFLOPS, tandis que le BR100 haut de gamme – qui est essentiellement deux BR104 sur un interposeur en silicium – offre des performances jusqu’à 256 FP32 TFLOPS ou 2 INT8 PetaFLOPS. Le BR104 de milieu de gamme est livré avec 32 Go de mémoire HBM2E, utilisant une interface 2048 bits qui fournit une bande passante de 819 Go/s. En revanche, le BR100 haut de gamme est équipé de 64 Go de mémoire HBM2E, avec une interface 4096 bits avec une bande passante de 1,64 To/s.
Cellule d’en-tête – Colonne 0 | Biren BR104 | Biren BR100 | Nvidia A100 | Nvidia H100 |
---|---|---|---|---|
Facteur de forme | Carte FHFL | Module OAM | SXM4 | SXM5 |
Nombre de transistors | ? | 77 milliards | 54,2 milliards | 80 milliards |
Nœud | N7 | N7 | N7 | 4N |
Pouvoir | 300W | 550W | 400W | 700W |
FP32 TFLOPS | 128 | 256 | 19.5 | 60 |
TF32+ TFLOPS | 256 | 512 | ? | ? |
TF32 TFLOPS | ? | ? | 156/312* | 500/1000* |
FP16 TFLOPS | ? | ? | 78 | 120 |
Tenseur TFLOPS FP16 | ? | ? | 312/624* | 1000/2000* |
BF16 TFLOPS | 512 | 1024 | 39 | 120 |
Tenseur BF16 TFLOPS | ? | ? | 312/624* | 1000/2000* |
INT8 | 1024 | 2048 | ? | ? |
Tenseur INT8 TFLOPS | ? | ? | 624/1248* | 2000/4000* |
Il y a une autre raison à l’optimisme des Biren. Ses efforts de collecte de fonds coïncident avec les efforts vigoureux du gouvernement chinois pour faire progresser son industrie nationale des semi-conducteurs. Cette décision est une réponse à une campagne menée par les États-Unis qui a empêché les entreprises chinoises d’acquérir de nombreux GPU de calcul d’AMD, d’Intel et de Nvidia, qui sont tous en concurrence avec les produits de Biren. Étant donné que les produits de Nvidia sont chers et rares, selon les médias, Biren peut vendre davantage de ses GPU, au moins aux entreprises qui n’utilisent pas la pile logicielle CUDA de Nvidia pour leurs charges de travail d’IA.
Mais Biren est également confronté à de nombreux défis. L’année dernière, TSMC a temporairement interrompu les livraisons de GPU de calcul à Biren dans le but de s’assurer qu’ils respectent les règles d’exportation américaines en termes de performances et de capacités. Cela a forcé l’entreprise à réduire ses effectifs pour réduire ses coûts. Apparemment, Biren peut se procurer suffisamment de silicium pour le moment, donc son travail principal pour le moment est de s’assurer que sa pile logicielle est compétitive par rapport à celles de Nvidia, Intel et AMD.
Dans ce domaine, Nvidia est extrêmement difficile à battre. La société a passé près de deux décennies à affiner CUDA et, ces dernières années, a investi des centaines de millions pour faire de CUDA la plate-forme de choix pour le développement de l’IA. Pour l’instant, de nombreux hyperscalers chinois préfèrent utiliser les GPU de Nvidia pour leurs produits d’IA en raison de la supériorité de CUDA et de la somme d’argent qu’ils ont déjà investie dans cet écosystème.