Nvidia présente l’incroyable instantané NeRF 2D à 3D Photo AI Processing

Les chercheurs de Nvidia ont développé une approche pour reconstruire une scène 3D à partir d’une poignée d’images 2D « presque instantanément ». Un nouveau billet de blog décrit l’exploit, qui exploite une nouvelle technologie populaire appelée Neural Radiance Fields (NeRF), qui est accélérée jusqu’à 1 000 fois par rapport aux implémentations concurrentes. La vitesse de traitement de Nvidia est en grande partie due à son accélération de l’IA tirant parti des Tensor Cores qui accélèrent à la fois la formation des modèles et le rendu des scènes. Si vous êtes intéressé mais que vous souhaitez un TLDR, jetez un coup d’œil à la courte vidéo intégrée directement ci-dessous.

Fournissant un contexte à sa démo, Nvidia dit que les techniques NeRF précédentes pouvaient prendre des heures pour s’entraîner pour une scène, puis quelques minutes pour rendre les scènes cibles. Bien que les résultats des précédentes implémentations plus lentes aient été bons, les chercheurs de Nvidia tirant parti de la technologie AI ont mis une fusée dans les performances, et donc Nvidia a la confiance nécessaire pour décrire sa technologie comme « Instant NeRF ».

(Crédit image : Nvidia)

Vous l’avez probablement déjà deviné, mais cette technologie NeRF utilise des réseaux de neurones pour représenter et restituer des scènes 3D réalistes basées sur une collection d’images 2D. La vidéo ci-dessus implique que seulement quatre clichés étaient nécessaires pour créer la représentation 3D que nous voyons en mouvement. Cependant, le blog pourrait être plus réaliste en expliquant que « le réseau de neurones nécessite quelques dizaines d’images prises à partir de plusieurs positions autour de la scène, ainsi que la position de la caméra de chacune de ces prises de vue ». Le réseau neuronal comble les vides de la scène à 360 degrés et peut prédire la couleur de la lumière rayonnant dans n’importe quelle direction, à partir de n’importe quel point de l’espace 3D pour plus de réalisme. Nvidia dit que la technique peut contourner les occlusions.

Source-138