Portal: Prelude RTX est une vitrine impressionnante de la technologie RTX Remix de Nvidia, qui prend ce qui était autrefois un mod source pour Portal et lui donne des fonctionnalités visuelles et une technologie qui rivalisent et même surpassent les versions triple AAA haut de gamme. C’est vraiment spectaculaire – et, espérons-le, l’un des nombreux remasters tracés à l’avenir à l’approche de la sortie des outils de modding RTX Remix.
Plus intéressant cependant, Prelude est également le premier jeu à prendre en charge RTX IO, un schéma de décompression accéléré par GPU fonctionnant sous Vulkan. Il s’agit essentiellement d’une version de marque Nvidia de Direct Storage 1.2, qui est également incluse dans Ratchet and Clank : Rift Apart qui sera lancé sur PC plus tard ce mois-ci. Son objectif est d’accélérer le chargement des jeux et la diffusion des actifs sur la plate-forme PC, et son inclusion ici nous donne une bonne excuse pour voir comment la technologie fonctionne.
Historiquement, le chargement impliquait des données de jeu telles que des textures ou des modèles transférés d’un disque dur vers la mémoire système, puis vers le GPU sous le contrôle du CPU. Il s’agissait d’une approche série assez lourde en latence, car le disque devait physiquement faire tourner la broche, localiser les données, puis charger les données bloc par bloc de manière à minimiser la quantité de recherche nécessaire.
Cette technique a assez bien fonctionné avec des actifs de jeu relativement petits chargés à partir de disques durs, mais avec des jeux d’une taille de centaines de gigaoctets avec des actifs extrêmement détaillés, toutes ces données doivent être compressées pour faire bon usage de l’espace de stockage et de la bande passante disponibles. Cela signifie que les actifs doivent être décompressés par le CPU avant de pouvoir être utilisés sur le GPU, et le temps supplémentaire et la charge CPU que cela impose signifient que l’approche traditionnelle commence à s’effondrer.
Heureusement, l’avènement du stockage flash rapide et à faible latence dans les SSD signifie que nous n’avons pas besoin de lire les données de manière séquentielle pour minimiser les temps de recherche – nous pouvons créer une nouvelle norme. Tout d’abord, nous voulons accéder aux données en parallèle pour réduire massivement les temps de chargement par rapport à l’ancien standard d’E/S Windows. Deuxièmement, nous voulons nous assurer que les données sont déplacées du stockage vers le GPU avant c’est décompressé. Les GPU ont beaucoup de cœurs et effectuent des tâches massivement parallèles comme la décompression mieux que les CPU, donc cette approche permet de gagner beaucoup de temps. Il s’agit du nouveau système envisagé pour RTX IO et Direct Storage 1.2, et il offre des temps de chargement plus rapides et, lorsqu’il est utilisé dans le jeu à des fins de streaming, une réduction de la charge du processeur qui peut potentiellement améliorer les performances.
Pour RTX IO, comme c’est le cas ici dans Portal Prelude RTX, les données sur disque sont compressées à l’aide du format GDeflate et déplacées temporairement vers la mémoire système, puis vers la VRAM et décompressées par le GPU. Ce format GDeflate est une norme de compression GPU ouverte de Nvidia, qui a été confiée à Microsoft et au groupe Kronos, et c’est le format que je m’attends à voir utilisé dans les jeux Direct Storage 1.2 utilisant DirectX sur PC – avec les GPU de Nvidia, AMD et Intel tous pris en charge.
En revanche, Portal : Prelude RTX utilise l’API graphique Vulkan, qui n’a pas d’appels standard convenus et indépendants du fournisseur pour la décompression GPU ; pour autant que je sache, il n’y a actuellement que les extensions proposées par Nvidia. Ces extensions de Nvidia pour la décompression GPU pourraient potentiellement être celles qui sont adaptées en gros par le groupe Kronos pour le Direct Storage Equivalent de Vulkan. En attendant, la décompression rapide du GPU dans Portal Prelude : RTX ne fonctionnera que sur les pilotes prenant en charge ces extensions spécifiques, c’est-à-dire sur les cartes graphiques Nvidia RTX.
Cependant, Portal Prelude RTX fonctionne toujours sur un paradigme de chargement plus traditionnel, ce qui signifie que RTX IO n’augmente pas les fréquences d’images. Après tout, RTX Remix ne remplace pas le moteur de jeu ni ne modifie la façon dont les niveaux sont divisés et chargés ; Au lieu de cela, RTX Remix change simplement la façon dont le rendu est effectué et la façon dont les actifs sont chargés pour alimenter ce rendu. Ceci est différent de Ratchet and Clank: Rift Apart, qui devrait également utiliser la décompression GPU pour accélérer le gameplay. Portal Prelude RTX bénéficie donc principalement en termes de temps de chargement dédiés et de temps de chargement des textures visibles.
Pour tester l’effet de la technologie ici, j’ai testé une version du jeu fonctionnant avec RTX IO désactivé et fonctionnant sur un SSD SATA plafonné à 500 Mo/s. Le jeu se charge assez rapidement, mais les textures mettent un certain temps à atteindre leur meilleure qualité – sans la compression GDeflate de RTXIO, le jeu sur disque est entièrement non compressé et environ 60 % plus grand. La bande passante est donc taxée en conséquence pour déplacer les textures dans la VRAM, ce qui prend un peu plus d’une seconde pour que la dernière texture se charge. Avec RTX IO activé, cette même texture sur un SSD SATA se charge en moins de la moitié du temps.
Configuration | Charger dans le jeu | Charge de texture |
---|---|---|
12900K + SSD SATA 500 Mo/s + RTX IO désactivé | 1.13s | 2.36s |
12900K + SSD SATA 500 Mo/s + E/S RTX sur | 0,67 s | 1.16s |
12900K + SSD NVMe 3,5 Go/s + RTX IO désactivé | 0,57 s | 1.45s |
12900K + SSD NVMe 3,5 Go/s + E/S RTX sur | 0.53s | 1.07s |
Ce n’est pas exactement la plus grande différence dans le monde réel, car une demi-seconde passe en un éclair, mais la réduction de moitié du temps est toujours impressionnante. Après avoir fait un certain nombre de tests dans différentes configurations, j’ai deux plats à emporter intéressants. Tout d’abord, un disque SATA de 500 Mo/s avec RTX IO activé bat un disque NVMe de 3,5 Go/s avec RTX IO désactivé – assez exceptionnel. Deuxièmement, les différences matérielles CPU et GPU n’ont pas eu d’impact considérable sur les temps de chargement, le système RTX 2060 Super + Core i9 12900K fonctionnant à peu près de la même manière que le même CPU avec le produit phare RTX 4090; un système RTX 4070 et Ryzen 5 3600 était également très proche en termes de temps de chargement.
Donc, Portal : Prelude RTX est une première sortie prometteuse de cette technologie sur PC, mais en même temps, elle est banale car elle s’applique à un jeu qui utilise en premier lieu un ancien paradigme de chargement. Avec des jeux qui utilisent le streaming actif et aucun écran de chargement d’aucune sorte, comme Ratchet and Clank : Rift Apart et d’autres futurs jeux, c’est là que cette technologie fera le mieux. Bien sûr, nous sommes impatients de couvrir ce titre très bientôt, avec le jeu qui arrivera sur PC le 26 juillet – alors restez à l’écoute.