Le nouveau firmware I/O+ optimisé pour le jeu de Phison pourrait bientôt arriver sur un SSD près de chez vous, apportant des performances de classe DirectStorage aux masses. Les passionnés sont ravis que l’API DirectStorage permette aux jeux de support de se charger en quelques secondes, apportant des performances explosives. Cependant, la nouvelle API permettra également des améliorations plus larges dans toutes sortes de tâches liées au stockage. Le premier jeu compatible DirectStorage, Forspoken, n’arrivera qu’en janvier 2023. Pourtant, Phison nous a donné accès à une première version de son nouveau micrologiciel qui transformera certains SSD existants alimentés par Phison en appareils compatibles DirectStorage.
Phison proposera initialement le micrologiciel I/O+ gratuit à ses OEM pour les disques utilisant son contrôleur PCIe 4.0 E18 haut de gamme, en se concentrant sur les modèles équipés du flash TLC rapide à 176 couches de Micron (B47R). Les fabricants peuvent choisir comment proposer ce micrologiciel, mais le micrologiciel est conçu pour répondre aux critères de haute qualité de DirectStorage pour les performances de jeu de nouvelle génération. Les futurs SSD Phison, comme ceux alimentés par le contrôleur E26, seront livrés avec une version de ce firmware par défaut.
Voyons d’abord comment ce micrologiciel fonctionne pour activer les performances de la classe DirectStorage, puis nous le mettrons à l’épreuve dans notre suite de tests.
Fonctionnement des SSD optimisés DirectStorage
L’API de stockage Microsoft Windows est conçue pour améliorer les performances de stockage spécifiquement en tirant parti des SSD NVMe rapides, mais l’adaptation des disques pour des performances optimales extraira les vitesses les plus rapides. L’API fonctionnera mieux sur Windows 11, mais elle fonctionnera également sur Windows 10.
L’idée générale est que la surcharge de la pile de stockage peut être réduite en éliminant les inefficacités via BypassIO, une voie optimisée vers le pilote StorNVMe et le périphérique de stockage qui réduit considérablement le nombre d’étapes nécessaires pour accéder aux données. Par exemple, BypassIO réduit le chemin de 11 étapes à trois, réduisant ainsi la surcharge et la latence du processeur. Le SSD NVMe peut ensuite être utilisé comme une sorte de cache pour diffuser des actifs et des données, réduisant ainsi la charge VRAM du GPU. Cela s’améliorera encore avec la décompression accélérée par le GPU à l’avenir.
Tout cela pose des défis aux SSD grand public actuels, car ils sont conçus pour des charges de travail en rafales plutôt que soutenues. Les tests personnalisés de Phison impliquent un disque plus complet qui doit supporter une énorme quantité d’activité de lecture de données sur plusieurs heures – 2,5 Go/s est un minimum pour une qualité médiocre, mais 5 Go/s + sont souhaitables. Par exemple, la première démo publique de Forspoken fonctionnait avec des détails moyens et nécessitait un flux constant de 4 Go/s depuis le SSD.
Traditionnellement, les métriques de performances des consommateurs du « monde réel » se sont concentrées sur des accès de 4 Ko à de faibles profondeurs de file d’attente allant de 1 à 4, mais DirectStorage utilisera de grands accès en lecture aléatoire à des profondeurs de file d’attente très élevées. Nous avons donc ici affaire à de grandes tailles de bloc de plus de 32 Ko et à une profondeur de file d’attente de plus de 512, ce qui est représentatif d’une charge de travail DirectStorage potentielle. En fait, nous devrions prévoir des E/S jusqu’à 1 Mo, 64 Ko étant une cible typique pour la cohérence.
Ce type de charge de travail met également à l’épreuve l’endurance d’un disque en raison de la « perturbation de la lecture des blocs », un processus qui crée une usure sur les blocs fréquemment lus, réduisant ainsi l’endurance. La gestion de cette condition est extrêmement importante avec les SSD DirectStorage – chaque bloc de données de jeu peut connaître jusqu’à 20 000 pages lues par heure sur une plage de 60 à 100 Go du disque.
La perturbation de lecture de bloc est une condition négligeable avec les variateurs standard. Cependant, le nouveau micrologiciel doit maintenir le flash en raison de la nature intense des charges de travail DirectStorage, tout en donnant la priorité aux demandes d’E/S de l’hôte. Marteler le flash avec des lectures introduit des erreurs de bits au fil du temps, ce qui peut affecter temporairement les performances, mais l’accès au lecteur reste très demandé. Phison a développé une planification intelligente de la maintenance avec des algorithmes d’usure adaptatifs qui fonctionnent de manière transparente en arrière-plan afin que les performances restent cohérentes avec une usure additive minimale.
Pouvoir exploiter pleinement la parallélisation native et la puissance de votre SSD NVMe est certainement une bonne chose, même si les développeurs de jeux mettront un certain temps à rattraper leur retard. La technologie peut également aider avec les applications, en particulier avec la création et la conception de contenu. Cela comprendrait l’édition et le rendu vidéo pour le premier, et l’apprentissage en profondeur ou la bioinformatique avec le second. La conception et la fabrication assistées par ordinateur (CAO/FAO) sont un autre domaine qui pourrait connaître une amélioration rapide. Phison dit également que la compilation du code source connaît également des accélérations notables.
Aujourd’hui, nous allons utiliser certains des tests DirectStorage synthétiques recommandés par Phison pour montrer le type de performances que le disque peut maintenir dans les conditions de charge de travail futures. Nous exécuterons également ce micrologiciel via notre suite de tests typique pour voir quel impact il pourrait avoir sur les applications quotidiennes. Phison s’attend à des performances normales ou à un léger gain. À l’avenir, nous aurons des produits de vente au détail, des références et des applications réelles visant à tester la nouvelle API. Une technologie similaire est également utilisée dans les consoles de la génération actuelle, nous devrons donc peut-être également explorer les impacts là-bas. Pour l’instant, nous ne vous donnons qu’un avant-goût.
Regarder de plus près
Phison recommande que tout lecteur doté de ce micrologiciel utilise un dissipateur thermique, car les charges de travail associées sont prolongées et éprouvantes. Plus précisément, ce micrologiciel est conçu pour des lectures aléatoires soutenues avec des tailles de bloc plus importantes, mais Phison s’est assuré que les zones de performances non optimisées ne subiront pas de dégradation des performances. Le micrologiciel peut également améliorer les performances d’écriture de ce flash spécifique car le TLC 176 couches de Micron a un potentiel inexploité.
De l’extérieur, le lecteur d’échantillons ne semble pas spécial. Il est similaire aux lecteurs de prévisualisation originaux de 2 To envoyés pour le contrôleur Phison E18 avec le flash à 176 couches de Micron. Nous voyons un contrôleur avec DRAM au milieu et un total de huit packages NAND, avec un autre package DRAM à l’arrière.
Les lecteurs de prévisualisation étaient livrés avec un dissipateur thermique installé, ce qui n’était pas le cas. Cela a du sens pour les apparences, mais ces charges de travail nécessitent un refroidissement. Heureusement, Phison a également envoyé un dissipateur thermique – le même que celui utilisé sur les lecteurs de prévisualisation – ce qui a beaucoup aidé.
Ici, nous voyons un contrôleur Phison E18 fabriqué au milieu de l’année dernière. Il est certainement possible pour les fabricants de proposer ce firmware pour leurs disques existants. Cependant, il peut y avoir des raisons valables de ne pas le faire, en particulier compte tenu de la dureté de ces charges de travail sur le SSD.
Deux modules DDR4 de 1 Go de SK hynix aident ce disque à rester en forme. Un aspect que nous voulons tester à l’avenir est l’impact de la DRAM sur les charges de travail DirectStorage. Normalement, la mise en cache DRAM est plus utile pour les écritures que pour les lectures, d’autant plus que les données « les plus chaudes » sont prioritaires. Les E/S plus importantes nécessitent également généralement moins de mémoire pour l’adressage.
La SRAM du contrôleur local et 64 Mo de mémoire système externe via la fonction de mémoire tampon de l’hôte (HMB) peuvent très bien suffire, mais nous pensons que le brassage de maintenance nécessaire pour un fonctionnement optimal bénéficiera de la DRAM, en particulier avec des disques de grande capacité.
Le lecteur est livré avec un flash TLC à 176 couches de Micron. Le firmware I/O+ est conçu pour fonctionner avec ce flash, mais il pourrait être étendu pour fonctionner avec des NAND plus anciens. Le B47R de Micron a très bien fonctionné sur divers disques avec plusieurs contrôleurs. C’est assez rapide, donc c’est un banc d’essai solide ici.
SUITE: Meilleurs SSD
SUITE: Comment nous testons les disques durs et les SSD
SUITE: Tout le contenu SSD