Microsoft souhaite lancer une puce d’IA alors qu’il cherche à se positionner comme l’Apple de l’IA, offrant une solution intégrée verticalement pour l’intelligence artificielle évolutive.
Selon L’information (s’ouvre dans un nouvel onglet), Microsoft travaille sur la puce, nom de code Athena, depuis 2019 et des échantillons d’ingénierie sont déjà disponibles pour certains employés de Microsoft et d’OpenAI. 2019 a été l’année où le premier a investi 1 milliard de dollars dans le second; il y a donc un lien probable entre le projet de puce et ce premier investissement.
D’autres sociétés basées aux États-Unis (Amazon, Google, Facebook) et des entités non américaines (Tencent, Alibaba) ont lancé leurs propres puces personnalisées pour l’IA dans le but d’obtenir une solution matérielle plus performante que ce qui est disponible dans le commerce. . Ces processeurs sont essentiels pour la formation à l’inférence et aux modèles de grande langue (LLM) et en ce moment, Nvidia accapare le marché avec l’A100 et le H100.
Ce faisant, ils imitent la pile matérielle et logicielle intégrée verticalement d’Apple, déployée sur des milliards d’appareils dans le monde. Microsoft a tenté en vain de suivre les traces d’Apple sur le marché grand public avec le malheureux Windows RT on Arm il y a près de dix ans, mais cette fois-ci, Microsoft semble être plus en contrôle et, surtout, pas à la traîne.
Économiser des milliards
Microsoft a, pour le moins, adopté l’intelligence artificielle à grande échelle avec enthousiasme. Il a intégré ChatGPT à tous ses produits et services phares (Bing, Microsoft 365, Github) et ce n’est qu’une question de temps avant qu’il ne soit déployé sur l’ensemble de sa pile Azure. Le plus grand obstacle au déploiement est le coût du matériel qui, selon les experts, pourrait atteindre des dizaines de milliards de dollars par an. Microsoft collabore déjà avec Nvidia pour construire un supercalculateur de nouvelle génération et il est probable que la plus grande société de logiciels au monde puisse tirer parti d’Athena pour obtenir de meilleurs tarifs ou une meilleure priorité de Nvidia à l’avenir.
Outre le fait qu’environ 300 personnes travaillent sur Athena chez Microsoft, l’information affirme également que la feuille de route de la puce comprend « plusieurs générations » et que la première génération sera fabriquée à l’aide du processus de fabrication 5 nm de TSMC. L’ancien architecte CPU d’Apple, Mike Filippo, est susceptible d’avoir un coup de main dans ce projet bien que son expertise repose davantage sur le CPU.
Dans une certaine mesure, Project Athena fait suite à Project Brainwave, le système alimenté par FPGA que Microsoft utilise depuis 2017, date à laquelle il a commencé à s’intéresser à l’IA. À l’époque, les cartes Intel Stratix 10 FPGA (Field Programmable Gate Array) étaient utilisées pour produire ce qui ressemble maintenant à la première ébauche de la stratégie Microsoft AI. Si Microsoft suit l’exemple de Google avec un produit de type TPU, nous pouvons nous attendre à beaucoup de mémoire à bande passante élevée (HBM), à un TDP relativement faible et à une focalisation laser sur les pics de FLOP par dollar.