Hogyan működik az Nvidia DLSS 3, és miért nem tudja egyelőre utolérni az FSR

Ez a történet Jacob Roach ReSpec sorozatának része, amely a PC-s játékok és a hardver világát fedi le.

Nvidia RTX 40-es sorozatú grafikus kártyák néhány héten belül megérkeznek, de a hardveres fejlesztések között ott van, hogy mi lehet az Nvidia aranytojása: DLSS 3. Ez sokkal több, mint az Nvidia népszerű DLSS (Deep Learning Super Sampling) funkciójának frissítése, és előfordulhat, hogy meghatározza az Nvidia következő generációját sokkal több, mint maguk a grafikus kártyák.

Tartalom

Hogyan működik a DLSS 3 (és hogyan nem)
Ahol az AI különbséget jelent
Miért nem tud utolérni az FSR 2.0 (egyelőre)

Ajánlott videók

Az AMD keményen dolgozik, hogy megszerezze FidelityFX szuperfelbontás (FSR) egyenrangú a DLSS-szel, és az elmúlt hónapokban sikeres volt. Úgy tűnik, hogy a DLSS 3 megváltoztatja ezt a dinamikát – és ezúttal az FSR nem biztos, hogy egyhamar utoléri.

Hogyan működik a DLSS 3 (és hogyan nem)

Egy diagram, amely bemutatja az Nvidia DLSS 3 technológiájának működését. — Nvidia

Megbocsátott volna, ha azt gondolná, hogy a DLSS 3 egy teljesen új verziója DLSS, de nem az. Vagy legalábbis nem teljesen új. A DLSS 3 gerincét ugyanaz a szuperfelbontású technológia adja, amely ma a DLSS-címeknél is elérhető, és az Nvidia vélhetően új verziókkal folytatja a fejlesztését. Az Nvidia szerint a DLSS 3 szuperfelbontású része most külön opcióként jelenik meg a grafikus beállításokban.

Összefüggő

Az Nvidia nem grafikus kártyákat árul, hanem DLSS-t
A Chrome Nvidia DLSS-re vonatkozó változata elindul, de még nem használhatja
Ez az oka annak, hogy az Nvidia AMD-illesztőprogramok elleni lövései egyszerűen nem jönnek össze

Az új rész a keretgenerálás. A DLSS 3 minden második képkocka során egy teljesen egyedi képkockát generál, lényegében minden nyolc látható képpontból hetet. Ennek illusztrációját láthatja az alábbi folyamatábrán. 4K esetén a GPU csak a pixeleket jeleníti meg 1080p felbontásban, és ezt az információt nem csak az aktuális, hanem a következő képkockához is felhasználja.

Egy diagram, amely bemutatja, hogy a DLSS 3 hogyan rekonstruálja a kereteket. — Nvidia

A keretgenerálás az Nvidia szerint a szuperfelbontás külön kapcsolója lesz. Ennek az az oka, hogy a keretgenerálás egyelőre csak RTX 40-es GPU-kon működik, míg a szuperfelbontás továbbra is minden RTX grafikus kártyán működik, még a DLSS 3-ra frissített játékokban is. Magától értetődik, de ha a képkockáinak fele teljesen generált, az növeli a teljesítményét nagyon.

A keretgenerálás azonban nem csak egy titkos mesterséges intelligencia szósz. Ban ben DLSS 2 és olyan eszközök, mint az FSR, a mozgásvektorok kulcsfontosságú bemenetek a felskálázáshoz. Leírják, hogy az objektumok hol mozognak egyik képkockából a másikba, de a mozgásvektorok csak a jelenet geometriájára vonatkoznak. A 3D geometriával nem rendelkező elemeket, például az árnyékokat, a visszaverődéseket és a részecskéket, hagyományosan elfedték a felskálázási folyamatból, hogy elkerüljék a vizuális műtermékeket.

Egy diagram, amely az Nvidia DLSS 3-on keresztül mozgatja. — Nvidia

A maszkolás nem választható, amikor egy mesterséges intelligencia teljesen egyedi keretet hoz létre, és itt lép működésbe az RTX 40-es sorozatú GPU-k Optical Flow Acceleratorja. Olyan, mint egy mozgásvektor, kivéve, hogy a grafikus kártya követi az egyes pixelek mozgását egyik képkockáról a másikra. Ez az optikai áramlási mező a mozgásvektorokkal, a mélységgel és a színekkel együtt hozzájárul a mesterséges intelligencia által generált képkockához.

Úgy hangzik, mint az összes fejjel, de van egy nagy probléma az AI által generált képkockákkal: növelik a késleltetést. Az AI által generált keret soha nem megy át a számítógépen – ez egy „hamis” keret, így nem fogja látni a hagyományos fps-kiolvasásokon játékokban vagy olyan eszközökben, mint a FRAPS. Tehát a késleltetés nem csökken annak ellenére, hogy annyi extra képkocka van, és az optikai áramlás számítási többlete miatt a késleltetés valójában nő. Emiatt a DLSS 3 megköveteli Nvidia Reflex a magasabb késleltetés ellensúlyozására.

Általában a CPU eltárol egy renderelési sort a grafikus kártya számára, hogy megbizonyosodjon arról, hogy a GPU soha nem vár a munka elvégzésére (ez akadozást és képkockasebesség csökkenést okoz). A Reflex eltávolítja a renderelési sort, és szinkronizálja a GPU-t és a CPU-t, így amint a CPU el tudja küldeni az utasításokat, a GPU elkezdi feldolgozni azokat. Ha a DLSS 3 tetejére alkalmazzák, az Nvidia szerint a Reflex néha még a késleltetés csökkenését is eredményezheti.

Ahol az AI különbséget jelent

Microsoft Flight Simulator | NVIDIA DLSS 3 – Exkluzív első megjelenés

Az AMD FSR 2.0 nem használ mesterséges intelligenciát, és ahogy már régebben írtam, bebizonyítja, hogy ugyanazt a minőséget kapja, mint a DLSS gépi tanulás helyett algoritmusokkal. A DLSS 3 ezen változtat egyedülálló keretgenerálási képességeivel, valamint az optikai áramlás bevezetésével.

Az optikai áramlás nem új ötlet – évtizedek óta létezik, és a videószerkesztő alkalmazásoktól az önvezető autókig mindenben alkalmazható. Azonban, optikai áramlás számítása gépi tanulással viszonylag új az AI modellek betanításához szükséges adatkészletek számának növekedése miatt. Az ok, amiért érdemes az AI-t használni, egyszerű: elegendő képzés mellett kevesebb vizuális hibát produkál, és futás közben nincs annyi többletterhelése.

A DLSS futás közben fut. Lehetőség van gépi tanulástól mentes algoritmus kidolgozására, amely megbecsüli, hogy az egyes pixelek hogyan mozognak egyik képkockáról a másikra. a következő, de számításilag drága, ami ellentétes az első szupermintavételezés lényegével. hely. Egy olyan mesterséges intelligencia modellel, amely nem igényel sok lóerőt és elegendő edzési adatot – és biztos lehetsz benne, az Nvidia rengeteg edzési adat, amellyel dolgozhat – olyan optikai áramlást érhet el, amely kiváló minőségű és végrehajtható futásidő.

Ez a képkockasebesség javulásához vezet még a CPU-korlátozott játékokban is. A szupermintavétel csak a felbontásra vonatkozik, ami szinte kizárólag a GPU-tól függ. Az új kerettel, amely megkerüli a CPU feldolgozást, a DLSS 3 megduplázhatja a képkockasebességet a játékokban még akkor is, ha teljes CPU szűk keresztmetszet. Ez lenyűgöző, és jelenleg csak az AI-val lehetséges.

Miért nem tud utolérni az FSR 2.0 (egyelőre)

FSR és DLSS képminőség összehasonlítás a God of Warban.

Az AMD valóban megtette a lehetetlent az FSR 2.0-val. Fantasztikusan néz ki, és az a tény, hogy márka-agnosztikus, még jobb. készen álltam rá árok DLSS az FSR 2.0-hoz mióta először megláttam Deathloop. De bármennyire is élvezem az FSR 2.0-t, és úgy gondolom, hogy ez egy nagyszerű készlet az AMD-től, nem fog egyhamar utolérni a DLSS 3-at.

Kezdetnek elég nehéz egy olyan algoritmus kidolgozása, amely minden képpontot a képkockák között műtermékektől mentesen képes követni, különösen egy sűrű, finom részletekkel rendelkező 3D környezetben (Cyberpunk 2077 kiváló példa). Lehetséges, de nehéz. A nagyobb probléma azonban az, hogy mennyire felfújtnak kell lennie ennek az algoritmusnak. Az egyes pixelek követése a 3D-s térben, az optikai áramlási számítás elvégzése, a keret létrehozása és az útközben előforduló hibák kiküszöbölése – sokat kell kérni.

Még több kérdés, ha ezt a játék futtatása közben szeretné futtatni, és továbbra is javítani kell a képkockasebességet az FSR 2.0 vagy a DLSS szintjén. Az Nvidiának még dedikált processzoraival és betanított modelljével is Reflexet kell használnia az optikai áramlás miatti magasabb késleltetés ellensúlyozására. E hardver vagy szoftver nélkül az FSR valószínűleg túl sok késleltetést keresne a keretek generálásához.

Nincs kétségem afelől, hogy az AMD és más fejlesztők előbb-utóbb eljutnak odáig – vagy találnak más megoldást a probléma megkerülésére –, de ez néhány év múlva is eltarthat. Nehéz most megmondani.

Hamarosan – GeForce RTX 4090 DLSS 3 First Look kedvcsináló előzetes

Könnyű azt mondani, hogy a DLSS 3 nagyon izgalmasnak tűnik. Természetesen meg kell várnunk, amíg megérkezik, hogy igazoljuk az Nvidia teljesítményre vonatkozó állításait, és megnézzük, hogyan állja meg a képminőséget. Egyelőre csak egy rövid videónk van a Digital Foundry-től, amely a DLSS 3 felvételeit mutatja be (fent), amelyet nagyon javaslok, hogy nézzenek meg, amíg nem látunk további harmadik féltől származó teszteket. A jelenlegi nézőpontunkból azonban a DLSS 3 minden bizonnyal ígéretesnek tűnik.

Ez a cikk része ReSpec – folyamatos, kéthetente megjelenő rovat, amely vitákat, tanácsokat és részletes beszámolókat tartalmaz a PC-s játékok mögötti technológiáról.

Szerkesztői ajánlások

Miért nem elég az Nvidia RTX 4060 Ti 2023-ra
Így szerezheti be ingyenesen a Redfall Bite Back Edition-t az Nvidiától
Egy hónapra AMD GPU-ra váltottam – ezért nem hiányzik az Nvidia
Ha az AMD RX 7900 XTX állításai igazak, akkor az Nvidia nagy bajban lehet
Az AMD letépi az olvadó RTX 4090 adaptert, miközben az Nvidia pert indít

Hogyan működik az Nvidia DLSS 3, és miért nem tudja egyelőre utolérni az FSR

Hogyan működik a DLSS 3 (és hogyan nem)

Ahol az AI különbséget jelent

Miért nem tud utolérni az FSR 2.0 (egyelőre)

Szerkesztői ajánlások

Kategóriák

Friss

Az Intel alacsony fogyasztású kijelzőtechnológiája (LPDT) hosszabb élettartamú laptopokat biztosít

A Return to Monkey Island titokban önéletrajz

5 alulértékelt Stephen King film, amit meg kell nézned