Hogyan működik az Nvidia DLSS 3, és miért nem tudja egyelőre utolérni az FSR

tiszteletben dt kiemelt kép 2
Ez a történet Jacob Roach ReSpec sorozatának része, amely a PC-s játékok és a hardver világát fedi le.

Nvidia RTX 40-es sorozatú grafikus kártyák néhány héten belül megérkeznek, de a hardveres fejlesztések között ott van, hogy mi lehet az Nvidia aranytojása: DLSS 3. Ez sokkal több, mint az Nvidia népszerű DLSS (Deep Learning Super Sampling) funkciójának frissítése, és előfordulhat, hogy meghatározza az Nvidia következő generációját sokkal több, mint maguk a grafikus kártyák.

Tartalom

  • Hogyan működik a DLSS 3 (és hogyan nem)
  • Ahol az AI különbséget jelent
  • Miért nem tud utolérni az FSR 2.0 (egyelőre)

Ajánlott videók

Az AMD keményen dolgozik, hogy megszerezze FidelityFX szuperfelbontás (FSR) egyenrangú a DLSS-szel, és az elmúlt hónapokban sikeres volt. Úgy tűnik, hogy a DLSS 3 megváltoztatja ezt a dinamikát – és ezúttal az FSR nem biztos, hogy egyhamar utoléri.

Hogyan működik a DLSS 3 (és hogyan nem)

Egy diagram, amely bemutatja az Nvidia DLSS 3 technológiájának működését.
Nvidia

Megbocsátott volna, ha azt gondolná, hogy a DLSS 3 egy teljesen új verziója DLSS, de nem az. Vagy legalábbis nem teljesen új. A DLSS 3 gerincét ugyanaz a szuperfelbontású technológia adja, amely ma a DLSS-címeknél is elérhető, és az Nvidia vélhetően új verziókkal folytatja a fejlesztését. Az Nvidia szerint a DLSS 3 szuperfelbontású része most külön opcióként jelenik meg a grafikus beállításokban.

Összefüggő

  • Az Nvidia nem grafikus kártyákat árul, hanem DLSS-t
  • A Chrome Nvidia DLSS-re vonatkozó változata elindul, de még nem használhatja
  • Ez az oka annak, hogy az Nvidia AMD-illesztőprogramok elleni lövései egyszerűen nem jönnek össze

Az új rész a keretgenerálás. A DLSS 3 minden második képkocka során egy teljesen egyedi képkockát generál, lényegében minden nyolc látható képpontból hetet. Ennek illusztrációját láthatja az alábbi folyamatábrán. 4K esetén a GPU csak a pixeleket jeleníti meg 1080p felbontásban, és ezt az információt nem csak az aktuális, hanem a következő képkockához is felhasználja.

Egy diagram, amely bemutatja, hogy a DLSS 3 hogyan rekonstruálja a kereteket.
Nvidia

A keretgenerálás az Nvidia szerint a szuperfelbontás külön kapcsolója lesz. Ennek az az oka, hogy a keretgenerálás egyelőre csak RTX 40-es GPU-kon működik, míg a szuperfelbontás továbbra is minden RTX grafikus kártyán működik, még a DLSS 3-ra frissített játékokban is. Magától értetődik, de ha a képkockáinak fele teljesen generált, az növeli a teljesítményét nagyon.

A keretgenerálás azonban nem csak egy titkos mesterséges intelligencia szósz. Ban ben DLSS 2 és olyan eszközök, mint az FSR, a mozgásvektorok kulcsfontosságú bemenetek a felskálázáshoz. Leírják, hogy az objektumok hol mozognak egyik képkockából a másikba, de a mozgásvektorok csak a jelenet geometriájára vonatkoznak. A 3D geometriával nem rendelkező elemeket, például az árnyékokat, a visszaverődéseket és a részecskéket, hagyományosan elfedték a felskálázási folyamatból, hogy elkerüljék a vizuális műtermékeket.

Egy diagram, amely az Nvidia DLSS 3-on keresztül mozgatja.
Nvidia

A maszkolás nem választható, amikor egy mesterséges intelligencia teljesen egyedi keretet hoz létre, és itt lép működésbe az RTX 40-es sorozatú GPU-k Optical Flow Acceleratorja. Olyan, mint egy mozgásvektor, kivéve, hogy a grafikus kártya követi az egyes pixelek mozgását egyik képkockáról a másikra. Ez az optikai áramlási mező a mozgásvektorokkal, a mélységgel és a színekkel együtt hozzájárul a mesterséges intelligencia által generált képkockához.

Úgy hangzik, mint az összes fejjel, de van egy nagy probléma az AI által generált képkockákkal: növelik a késleltetést. Az AI által generált keret soha nem megy át a számítógépen – ez egy „hamis” keret, így nem fogja látni a hagyományos fps-kiolvasásokon játékokban vagy olyan eszközökben, mint a FRAPS. Tehát a késleltetés nem csökken annak ellenére, hogy annyi extra képkocka van, és az optikai áramlás számítási többlete miatt a késleltetés valójában nő. Emiatt a DLSS 3 megköveteli Nvidia Reflex a magasabb késleltetés ellensúlyozására.

Általában a CPU eltárol egy renderelési sort a grafikus kártya számára, hogy megbizonyosodjon arról, hogy a GPU soha nem vár a munka elvégzésére (ez akadozást és képkockasebesség csökkenést okoz). A Reflex eltávolítja a renderelési sort, és szinkronizálja a GPU-t és a CPU-t, így amint a CPU el tudja küldeni az utasításokat, a GPU elkezdi feldolgozni azokat. Ha a DLSS 3 tetejére alkalmazzák, az Nvidia szerint a Reflex néha még a késleltetés csökkenését is eredményezheti.

Ahol az AI különbséget jelent

Microsoft Flight Simulator | NVIDIA DLSS 3 – Exkluzív első megjelenés

Az AMD FSR 2.0 nem használ mesterséges intelligenciát, és ahogy már régebben írtam, bebizonyítja, hogy ugyanazt a minőséget kapja, mint a DLSS gépi tanulás helyett algoritmusokkal. A DLSS 3 ezen változtat egyedülálló keretgenerálási képességeivel, valamint az optikai áramlás bevezetésével.

Az optikai áramlás nem új ötlet – évtizedek óta létezik, és a videószerkesztő alkalmazásoktól az önvezető autókig mindenben alkalmazható. Azonban, optikai áramlás számítása gépi tanulással viszonylag új az AI modellek betanításához szükséges adatkészletek számának növekedése miatt. Az ok, amiért érdemes az AI-t használni, egyszerű: elegendő képzés mellett kevesebb vizuális hibát produkál, és futás közben nincs annyi többletterhelése.

A DLSS futás közben fut. Lehetőség van gépi tanulástól mentes algoritmus kidolgozására, amely megbecsüli, hogy az egyes pixelek hogyan mozognak egyik képkockáról a másikra. a következő, de számításilag drága, ami ellentétes az első szupermintavételezés lényegével. hely. Egy olyan mesterséges intelligencia modellel, amely nem igényel sok lóerőt és elegendő edzési adatot – és biztos lehetsz benne, az Nvidia rengeteg edzési adat, amellyel dolgozhat – olyan optikai áramlást érhet el, amely kiváló minőségű és végrehajtható futásidő.

Ez a képkockasebesség javulásához vezet még a CPU-korlátozott játékokban is. A szupermintavétel csak a felbontásra vonatkozik, ami szinte kizárólag a GPU-tól függ. Az új kerettel, amely megkerüli a CPU feldolgozást, a DLSS 3 megduplázhatja a képkockasebességet a játékokban még akkor is, ha teljes CPU szűk keresztmetszet. Ez lenyűgöző, és jelenleg csak az AI-val lehetséges.

Miért nem tud utolérni az FSR 2.0 (egyelőre)

FSR és DLSS képminőség összehasonlítás a God of Warban.

Az AMD valóban megtette a lehetetlent az FSR 2.0-val. Fantasztikusan néz ki, és az a tény, hogy márka-agnosztikus, még jobb. készen álltam rá árok DLSS az FSR 2.0-hoz mióta először megláttam Deathloop. De bármennyire is élvezem az FSR 2.0-t, és úgy gondolom, hogy ez egy nagyszerű készlet az AMD-től, nem fog egyhamar utolérni a DLSS 3-at.

Kezdetnek elég nehéz egy olyan algoritmus kidolgozása, amely minden képpontot a képkockák között műtermékektől mentesen képes követni, különösen egy sűrű, finom részletekkel rendelkező 3D környezetben (Cyberpunk 2077 kiváló példa). Lehetséges, de nehéz. A nagyobb probléma azonban az, hogy mennyire felfújtnak kell lennie ennek az algoritmusnak. Az egyes pixelek követése a 3D-s térben, az optikai áramlási számítás elvégzése, a keret létrehozása és az útközben előforduló hibák kiküszöbölése – sokat kell kérni.

Még több kérdés, ha ezt a játék futtatása közben szeretné futtatni, és továbbra is javítani kell a képkockasebességet az FSR 2.0 vagy a DLSS szintjén. Az Nvidiának még dedikált processzoraival és betanított modelljével is Reflexet kell használnia az optikai áramlás miatti magasabb késleltetés ellensúlyozására. E hardver vagy szoftver nélkül az FSR valószínűleg túl sok késleltetést keresne a keretek generálásához.

Nincs kétségem afelől, hogy az AMD és más fejlesztők előbb-utóbb eljutnak odáig – vagy találnak más megoldást a probléma megkerülésére –, de ez néhány év múlva is eltarthat. Nehéz most megmondani.

Hamarosan – GeForce RTX 4090 DLSS 3 First Look kedvcsináló előzetes

Könnyű azt mondani, hogy a DLSS 3 nagyon izgalmasnak tűnik. Természetesen meg kell várnunk, amíg megérkezik, hogy igazoljuk az Nvidia teljesítményre vonatkozó állításait, és megnézzük, hogyan állja meg a képminőséget. Egyelőre csak egy rövid videónk van a Digital Foundry-től, amely a DLSS 3 felvételeit mutatja be (fent), amelyet nagyon javaslok, hogy nézzenek meg, amíg nem látunk további harmadik féltől származó teszteket. A jelenlegi nézőpontunkból azonban a DLSS 3 minden bizonnyal ígéretesnek tűnik.

Ez a cikk része ReSpec – folyamatos, kéthetente megjelenő rovat, amely vitákat, tanácsokat és részletes beszámolókat tartalmaz a PC-s játékok mögötti technológiáról.

Szerkesztői ajánlások

  • Miért nem elég az Nvidia RTX 4060 Ti 2023-ra
  • Így szerezheti be ingyenesen a Redfall Bite Back Edition-t az Nvidiától
  • Egy hónapra AMD GPU-ra váltottam – ezért nem hiányzik az Nvidia
  • Ha az AMD RX 7900 XTX állításai igazak, akkor az Nvidia nagy bajban lehet
  • Az AMD letépi az olvadó RTX 4090 adaptert, miközben az Nvidia pert indít