Jak funguje Nvidia DLSS 3 a proč FSR zatím nestíhá

Respekt dt doporučený obrázek 2
Tento příběh je součástí série ReSpec Jacoba Roacha, která pokrývá svět počítačových her a hardwaru.

od společnosti Nvidia Grafické karty řady RTX 40 dorazí za několik krátkých týdnů, ale mezi všemi hardwarovými vylepšeními je to, co by mohlo být zlatým vejcem Nvidie: DLSS 3. Je to mnohem víc než jen aktualizace oblíbené funkce DLSS (Deep Learning Super Sampling) společnosti Nvidia a mohlo by to skončit definující další generaci Nvidie mnohem více než samotné grafické karty.

Obsah

  • Jak DLSS 3 funguje (a jak nefunguje)
  • Kde AI dělá rozdíl
  • Proč FSR 2.0 nemůže dohnat (prozatím)

Doporučená videa

AMD na tom tvrdě pracovalo FidelityFX Super Resolution (FSR) na stejné úrovni jako DLSS a za posledních několik měsíců byla úspěšná. DLSS 3 vypadá, že tuto dynamiku změní – a tentokrát FSR možná nebude moci v dohledné době dohnat.

Jak DLSS 3 funguje (a jak nefunguje)

Graf ukazující, jak funguje technologie DLSS 3 společnosti Nvidia.
Nvidia

Bylo by vám odpuštěno, že si myslíte, že DLSS 3 je zcela nová verze DLSS, ale není. Nebo alespoň není úplně nová. Páteří DLSS 3 je stejná technologie s vysokým rozlišením, která je dnes k dispozici v titulech DLSS, a Nvidia ji bude pravděpodobně nadále vylepšovat novými verzemi. Nvidia říká, že nyní uvidíte část DLSS 3 v super rozlišení jako samostatnou možnost v nastavení grafiky.

Příbuzný

  • Nvidia neprodává grafické karty – prodává DLSS
  • Spuštění Chrome na Nvidia DLSS je připraveno, ale zatím jej nemůžete používat
  • Zde je důvod, proč střely Nvidie proti ovladačům AMD prostě nesedí

Novou částí je generování rámů. DLSS 3 vygeneruje každý druhý snímek zcela jedinečný snímek, v podstatě generuje sedm z každých osmi pixelů, které vidíte. Ilustraci toho můžete vidět ve vývojovém diagramu níže. V případě 4K vaše GPU pouze vykreslí pixely pro 1080p a použije tyto informace nejen pro aktuální snímek, ale i pro další snímek.

Graf ukazující, jak DLSS 3 rekonstruuje snímky.
Nvidia

Generování snímků bude podle Nvidie samostatným přepínačem od super rozlišení. Je to proto, že generování snímků zatím funguje pouze na GPU řady RTX 40, zatímco super rozlišení bude nadále fungovat na všech grafických kartách RTX, a to i ve hrách, které byly aktualizovány na DLSS 3. Mělo by to být samozřejmé, ale pokud je polovina vašich snímků zcela vygenerována, zvýší to váš výkon mnoho.

Generování snímků však není jen nějaká tajná omáčka AI. v DLSS 2 a nástroje jako FSR, pohybové vektory jsou klíčovým vstupem pro upscaling. Popisují, kde se objekty pohybují z jednoho snímku do druhého, ale pohybové vektory se vztahují pouze na geometrii ve scéně. Prvky, které nemají 3D geometrii, jako jsou stíny, odrazy a částice, byly tradičně maskovány z procesu upscalingu, aby se zabránilo vizuálním artefaktům.

Graf pohybující se prostřednictvím DLSS 3 Nvidie.
Nvidia

Maskování není možné, když AI generuje zcela jedinečný snímek, což je místo, kde vstupuje do hry optický akcelerátor toku v GPU řady RTX 40. Je to jako pohybový vektor, až na to, že grafická karta sleduje pohyb jednotlivých pixelů z jednoho snímku do druhého. Toto pole optického toku spolu s pohybovými vektory, hloubkou a barvou přispívají k rámu generovanému AI.

Zní to jako všechny výhody, ale se snímky generovanými AI je velký problém: zvyšují latenci. Snímek generovaný umělou inteligencí nikdy neprojde vaším počítačem – je to „falešný“ snímek, takže jej neuvidíte na tradičních odečtech snímků za sekundu ve hrách nebo nástrojích, jako je FRAPS. Latence tedy neklesá, přestože má tolik snímků navíc, a kvůli výpočetní režii optického toku se latence ve skutečnosti zvyšuje. Z tohoto důvodu vyžaduje DLSS 3 Nvidia Reflex pro kompenzaci vyšší latence.

Normálně váš procesor ukládá frontu vykreslování pro vaši grafickou kartu, aby se ujistil, že vaše GPU nikdy nečeká na práci (což by způsobilo zadrhávání a pokles snímkové frekvence). Reflex odstraní frontu vykreslování a synchronizuje váš GPU a CPU, takže jakmile váš CPU může odeslat pokyny, GPU je začne zpracovávat. Při aplikaci přes DLSS 3 Nvidia říká, že Reflex může někdy dokonce vést ke snížení latence.

Kde AI dělá rozdíl

Microsoft Flight Simulator | NVIDIA DLSS 3 – exkluzivní první pohled

AMD FSR 2.0 nepoužívá AI, a jak jsem před časem psal, dokazuje, že můžete získat stejnou kvalitu jako DLSS s algoritmy místo strojového učení. DLSS 3 to mění svými jedinečnými možnostmi generování snímků a také zavedením optického toku.

Optický tok není nový nápad – existuje již desítky let a má uplatnění ve všem, od aplikací pro úpravu videa až po samořídící auta. Nicméně, výpočet optického toku pomocí strojového učení je relativně nový kvůli nárůstu datových sad pro trénování modelů AI. Důvod, proč byste chtěli používat AI, je jednoduchý: produkuje méně vizuálních chyb při dostatečném školení a nemá tolik režie za běhu.

DLSS se spouští za běhu. Je možné vyvinout algoritmus bez strojového učení, který by odhadoval, jak se každý pixel pohybuje z jednoho snímku do druhého. další, ale je to výpočetně drahé, což je v rozporu s celým smyslem supervzorkování v prvním místo. S modelem AI, který nevyžaduje mnoho koňských sil a dostatek tréninkových dat – a buďte si jisti, Nvidia má spousta tréninkových dat, se kterými můžete pracovat – můžete dosáhnout optického toku, který je vysoce kvalitní a lze jej provádět runtime.

To vede ke zlepšení snímkové frekvence i ve hrách, které jsou omezeny CPU. Supersampling se týká pouze vašeho rozlišení, které je téměř výhradně závislé na vašem GPU. Díky novému snímku, který obchází procesorové zpracování, může DLSS 3 zdvojnásobit snímkovou frekvenci ve hrách, i když máte kompletní Úzké hrdlo CPU. To je působivé a v současné době je to možné pouze s AI.

Proč FSR 2.0 nemůže dohnat (prozatím)

Porovnání kvality obrazu FSR a DLSS v God of War.

AMD skutečně dokázalo nemožné s FSR 2.0. Vypadá to fantasticky a skutečnost, že je agnostika pro značku, je ještě lepší. byl jsem připraven příkop DLSS pro FSR 2.0 od té doby, co jsem to poprvé viděl Deathloop. Ale jakkoli se mi líbí FSR 2.0 a myslím si, že je to skvělý kus sady od AMD, v brzké době to nedožene DLSS 3.

Pro začátečníky je vývoj algoritmu, který dokáže sledovat každý pixel mezi snímky bez artefaktů, dostatečně náročný, zvláště ve 3D prostředí s hustými jemnými detaily (Cyberpunk 2077 je ukázkovým příkladem). Je to možné, ale náročné. Větším problémem však je, jak nabubřelý by tento algoritmus musel být. Sledování každého pixelu ve 3D prostoru, provádění výpočtu optického toku, generování rámečku a odstraňování případných nehod, které se na cestě stanou – je toho hodně, na co se ptáte.

Aby to fungovalo, když je hra spuštěna, a stále poskytovalo zlepšení snímkové frekvence na úrovni FSR 2.0 nebo DLSS, to je ještě víc, než se ptát. Nvidia, i s dedikovanými procesory a vyškoleným modelem, musí stále používat Reflex, aby kompenzovala vyšší latenci způsobenou optickým tokem. Bez tohoto hardwaru nebo softwaru by FSR pravděpodobně obchodovalo příliš mnoho latence na generování snímků.

Nepochybuji o tom, že AMD a další vývojáři se tam nakonec dostanou – nebo najdou jiný způsob, jak problém obejít – ale to by mohlo trvat několik let. Těžko teď říct.

Již brzy – upoutávka na první pohled GeForce RTX 4090 DLSS 3

Je snadné říci, že DLSS 3 vypadá velmi vzrušující. Samozřejmě budeme muset počkat, až to bude tady, abychom ověřili nároky Nvidie na výkon a uvidíme, jak se kvalita obrazu drží. Zatím máme jen krátké video od Digital Foundry ukazující záběry DLSS 3 (výše), které bych vřele doporučil sledovat, dokud neuvidíme další testování třetí stranou. Z našeho současného pohledu však DLSS 3 určitě vypadá slibně.

Tento článek je součástí ReSpec – průběžný dvoutýdenní sloupek, který zahrnuje diskuze, rady a podrobné zprávy o technologiích, které stojí za hraním na PC.

Doporučení redakce

  • Proč Nvidia RTX 4060 Ti prostě nestačí pro rok 2023
  • Zde je návod, jak zdarma získat Redfall Bite Back Edition od Nvidie
  • Na měsíc jsem přešel na AMD GPU – tady je důvod, proč mi Nvidia nechybí
  • Pokud jsou tvrzení AMD RX 7900 XTX pravdivá, Nvidia by mohla mít velké potíže
  • AMD roztrhá tající adaptér RTX 4090, protože Nvidia čelí hromadné žalobě