En tant que l’une des principales sociétés de cloud computing, Microsoft utilise les GPU de centre de données d’AMD ainsi que Linux sur les serveurs qu’il utilise. Parfois, ces GPU doivent être installés sur des machines en cours d’exécution ou remplacés, mais cela nécessite d’arrêter le serveur, puis de remplacer le GPU. Pour permettre des remplacements hot-plug sans faille, ce qui signifie que le GPU peut être retiré de l’emplacement PCIe et remplacé pendant que l’ordinateur fonctionne encore, Microsoft a développé un pilote spécial qui permet de brancher à chaud les GPU AMD sur les serveurs Linux.
Le correctif AMD GPU PCIe hot-plug de Microsoft pour Linux a été publié sur la liste de diffusion et sur GitHub pour révision et test, rapporte Phoronix. Le correctif a été conçu pour Linux et est destiné aux machines Azure de Microsoft qui peuvent bénéficier de la possibilité de brancher à chaud des accélérateurs basés sur GPU en cas de besoin.
« Nous sommes de Microsoft Research et travaillons sur la technologie de désagrégation GPU », lit-on dans une demande de révision de code. « Nous avons créé un patch […]qui activera la prise en charge de la connexion à chaud PCIe pour le GPU AMD. […] Nous pensons que la prise en charge de l’enfichage à chaud des périphériques GPU peut ouvrir des portes à de nombreuses applications avancées dans les centres de données au cours des prochaines années, et nous aimerions avoir des critiques sur ce PR afin que nous puissions poursuivre les discussions techniques autour de cette fonctionnalité. »
Bien que Microsoft n’ait divulgué aucun détail sur sa technologie de désagrégation GPU, il semble qu’il s’agisse d’une capacité propriétaire qui permet aux machines Azure d’ajouter dynamiquement l’accélération GPU aux serveurs sur lesquels les cartes ne sont pas physiquement installées. Étant donné que les machines qui hébergeront le matériel GPU réel fonctionnent dans des conditions difficiles (car les GPU de calcul et de jeu ont tendance à chauffer, surchauffer et tomber en panne), la prise en charge de la connexion à chaud du GPU sera une fonctionnalité particulièrement utile pour eux.
Le branchement à chaud d’une carte graphique ou d’un accélérateur n’est pas entièrement nouveau, mais le faire via l’interface PCIe l’est. AMD a déjà développé un pilote qui permet de brancher à chaud une carte graphique sur un port Thunderbolt 3 à l’aide d’un boîtier eGFX il y a des années. Cependant, il semble qu’AMD ne prenne pas encore en charge cette fonctionnalité pour ses GPU de centre de données. C’est apparemment là que les ingénieurs de Microsoft entrent en jeu pour aider son partenaire et obtenir un avantage pour la division Azure de l’entreprise.