Jak działa Nvidia DLSS 3 i dlaczego FSR nie może na razie nadrobić zaległości

respec dt wyróżniony obraz 2
Ta historia jest częścią serii ReSpec Jacoba Roacha, obejmującej świat gier komputerowych i sprzętu.

Nvidii Karty graficzne z serii RTX 40 pojawią się za kilka krótkich tygodni, ale wśród wszystkich ulepszeń sprzętowych leży to, co może być złotym jajkiem Nvidii: DLSS 3. To znacznie więcej niż tylko aktualizacja popularnej funkcji Nvidii DLSS (Deep Learning Super Sampling) i może się to skończyć definiujące następną generację Nvidii znacznie więcej niż same karty graficzne.

Zawartość

  • Jak działa DLSS 3 (i jak nie działa)
  • Gdzie sztuczna inteligencja robi różnicę
  • Dlaczego FSR 2.0 nie może nadrobić zaległości (na razie)

Polecane filmy

AMD ciężko pracowało, aby go zdobyć Superrozdzielczość FidelityFX (FSR) na równi z DLSS i od kilku miesięcy odnosi sukcesy. Wygląda na to, że DLSS 3 zmieni tę dynamikę — i tym razem FSR może nie nadążyć w najbliższym czasie.

Jak działa DLSS 3 (i jak nie działa)

Wykres pokazujący, jak działa technologia DLSS 3 firmy Nvidia.
Nvidia

Wybaczono by ci myślenie, że DLSS 3 to zupełnie nowa wersja DLSS, ale nie jest. A przynajmniej nie jest to całkiem nowe. Podstawą DLSS 3 jest ta sama technologia super-rozdzielczości, która jest obecnie dostępna w tytułach DLSS, a Nvidia prawdopodobnie będzie ją ulepszać w nowych wersjach. Nvidia mówi, że teraz zobaczysz część DLSS 3 o super rozdzielczości jako oddzielną opcję w ustawieniach graficznych.

Powiązany

  • Nvidia nie sprzedaje kart graficznych — sprzedaje DLSS
  • Podejście Chrome do Nvidii DLSS ma zostać uruchomione, ale nie możesz jeszcze z niego korzystać
  • Oto dlaczego strzały Nvidii przeciwko sterownikom AMD po prostu się nie sumują

Nową częścią jest generowanie ramek. DLSS 3 wygeneruje całkowicie unikalną klatkę co drugą klatkę, zasadniczo generując siedem z każdych ośmiu pikseli, które widzisz. Możesz zobaczyć ilustrację tego na poniższym schemacie blokowym. W przypadku 4K Twój GPU renderuje piksele tylko dla 1080p i wykorzystuje te informacje nie tylko dla bieżącej klatki, ale także dla następnej klatki.

Wykres pokazujący, jak DLSS 3 rekonstruuje ramki.
Nvidia

Generowanie klatek, według Nvidii, będzie osobnym przełącznikiem od super rozdzielczości. To dlatego, że generowanie klatek działa na razie tylko na procesorach graficznych RTX z serii 40, podczas gdy superrozdzielczość będzie nadal działać na wszystkich kartach graficznych RTX, nawet w grach, które zostały zaktualizowane do DLSS 3. To powinno być oczywiste, ale jeśli połowa twoich klatek zostanie w pełni wygenerowana, zwiększy to twoją wydajność bardzo.

Generowanie klatek to jednak nie tylko tajny sos AI. W DLSS 2 i narzędzia takie jak FSR, wektory ruchu są kluczowymi danymi wejściowymi do skalowania w górę. Opisują, gdzie obiekty poruszają się z jednej klatki do drugiej, ale wektory ruchu mają zastosowanie tylko do geometrii sceny. Elementy, które nie mają geometrii 3D, takie jak cienie, odbicia i cząsteczki, były tradycyjnie maskowane podczas procesu skalowania, aby uniknąć artefaktów wizualnych.

Ruch wykresu przez DLSS 3 firmy Nvidia.
Nvidia

Maskowanie nie wchodzi w grę, gdy sztuczna inteligencja generuje całkowicie unikalną klatkę, w której do gry wchodzi Optical Flow Accelerator w procesorach graficznych z serii RTX 40. To jest jak wektor ruchu, z wyjątkiem tego, że karta graficzna śledzi ruch poszczególnych pikseli z jednej klatki do drugiej. To pole przepływu optycznego, wraz z wektorami ruchu, głębią i kolorem, składa się na ramkę generowaną przez sztuczną inteligencję.

Brzmi to jak same plusy, ale jest duży problem z ramkami generowanymi przez sztuczną inteligencję: zwiększają one opóźnienie. Klatka generowana przez sztuczną inteligencję nigdy nie przechodzi przez komputer — jest to „fałszywa” ramka, więc nie zobaczysz jej na tradycyjnych odczytach klatek na sekundę w grach lub narzędziach takich jak FRAPS. Tak więc opóźnienie nie spada pomimo tak wielu dodatkowych ramek, a ze względu na obciążenie obliczeniowe przepływu optycznego opóźnienie faktycznie rośnie. Z tego powodu DLSS 3 wymaga Nvidia Reflex aby zrównoważyć większe opóźnienie.

Zwykle twój procesor przechowuje kolejkę renderowania dla twojej karty graficznej, aby upewnić się, że twój GPU nigdy nie czeka na wykonanie pracy (co spowodowałoby zacinanie się i spadki liczby klatek na sekundę). Reflex usuwa kolejkę renderowania i synchronizuje kartę graficzną i procesor, dzięki czemu gdy tylko procesor może wysłać instrukcje, karta graficzna zaczyna je przetwarzać. Nvidia twierdzi, że po zastosowaniu ponad DLSS 3 Reflex może czasami nawet spowodować zmniejszenie opóźnień.

Gdzie sztuczna inteligencja robi różnicę

Microsoft Flight Simulator | NVIDIA DLSS 3 — ekskluzywne pierwsze spojrzenie

AMD FSR 2.0 nie korzysta z AI i jak pisałem jakiś czas temu, udowadnia, że ​​można uzyskać taką samą jakość jak DLSS z algorytmami zamiast uczenia maszynowego. DLSS 3 zmienia to dzięki unikalnym możliwościom generowania ramek, a także wprowadzeniu przepływu optycznego.

Przepływ optyczny nie jest nowym pomysłem — istnieje od dziesięcioleci i ma zastosowanie we wszystkim, od aplikacji do edycji wideo po samojezdne samochody. Jednakże, obliczanie przepływu optycznego za pomocą uczenia maszynowego jest stosunkowo nowy ze względu na wzrost liczby zestawów danych, na których można trenować modele sztucznej inteligencji. Powód, dla którego warto używać sztucznej inteligencji, jest prosty: generuje mniej błędów wizualnych przy wystarczającym przeszkoleniu i nie ma tak dużego narzutu w czasie wykonywania.

DLSS jest wykonywany w czasie wykonywania. Możliwe jest opracowanie algorytmu, który nie wymaga uczenia maszynowego, aby oszacować, w jaki sposób każdy piksel przemieszcza się z jednej klatki do drugiej następny, ale jest kosztowny obliczeniowo, co jest sprzeczne z całym celem supersamplingu w pierwszym miejsce. Dzięki modelowi sztucznej inteligencji, który nie wymaga dużej mocy i wystarczającej ilości danych treningowych — i bądź pewien, że Nvidia ma mnóstwo danych treningowych do pracy — możesz osiągnąć przepływ optyczny, który jest wysokiej jakości i można go wykonać czas działania.

Prowadzi to do poprawy liczby klatek na sekundę nawet w grach z ograniczonym procesorem. Supersampling dotyczy tylko twojej rozdzielczości, która jest prawie wyłącznie zależna od twojej karty graficznej. Dzięki nowej klatce, która omija przetwarzanie procesora, DLSS 3 może podwoić liczbę klatek na sekundę w grach, nawet jeśli masz pełną Wąskie gardło procesora. To imponujące i obecnie możliwe tylko dzięki sztucznej inteligencji.

Dlaczego FSR 2.0 nie może nadrobić zaległości (na razie)

Porównanie jakości obrazu FSR i DLSS w grze God of War.

AMD naprawdę dokonało niemożliwego dzięki FSR 2.0. Wygląda fantastycznie, a fakt, że jest niezależny od marki, jest jeszcze lepszy. Byłem gotowy porzuć DLSS dla FSR 2.0 odkąd pierwszy raz go zobaczyłem Deathloop. Ale tak bardzo, jak lubię FSR 2.0 i uważam, że jest to świetny zestaw od AMD, nie dogoni DLSS 3 w najbliższym czasie.

Na początek opracowanie algorytmu, który może śledzić każdy piksel między klatkami bez artefaktów, jest wystarczająco trudne, zwłaszcza w środowisku 3D z gęstymi drobnymi szczegółami (Cyberpunka 2077 jest doskonałym przykładem). To możliwe, ale trudne. Większym problemem jest jednak to, jak rozdęty musiałby być ten algorytm. Śledzenie każdego piksela w przestrzeni 3D, obliczanie przepływu optycznego, generowanie ramki i usuwanie wszelkich nieszczęść, które mają miejsce po drodze — wymaga wiele.

Uruchomienie tego podczas działania gry i nadal zapewniające poprawę liczby klatek na sekundę na poziomie FSR 2.0 lub DLSS, to jeszcze więcej. Nvidia, nawet z dedykowanymi procesorami i wyszkolonym modelem, nadal musi używać Reflex, aby zrównoważyć większe opóźnienia narzucone przez przepływ optyczny. Bez tego sprzętu lub oprogramowania FSR prawdopodobnie zamieniłby zbyt duże opóźnienie na generowanie ramek.

Nie mam wątpliwości, że AMD i inni programiści w końcu tam dotrą – lub znajdą inny sposób obejścia problemu – ale może to zająć kilka lat. Trudno teraz powiedzieć.

Już wkrótce — pierwszy zwiastun karty GeForce RTX 4090 DLSS 3

Łatwo powiedzieć, że DLSS 3 wygląda bardzo ekscytująco. Oczywiście będziemy musieli poczekać, aż będzie tutaj, aby zweryfikować twierdzenia Nvidii dotyczące wydajności i zobaczyć, jak utrzyma się jakość obrazu. Jak dotąd mamy tylko krótki film z Digital Foundry pokazujący materiał DLSS 3 (powyżej), który gorąco polecam obejrzeć, dopóki nie zobaczymy dalszych testów stron trzecich. Jednak z naszego obecnego punktu widzenia DLSS 3 z pewnością wygląda obiecująco.

Ten artykuł jest częścią ReSpec – trwająca co dwa tygodnie kolumna zawierająca dyskusje, porady i szczegółowe raporty na temat technologii stojących za grami komputerowymi.

Zalecenia redaktorów

  • Dlaczego Nvidia RTX 4060 Ti po prostu nie wystarczy na 2023 rok
  • Oto jak zdobyć Redfall Bite Back Edition za darmo od Nvidii
  • Przełączyłem się na procesor graficzny AMD na miesiąc — oto dlaczego nie tęsknię za Nvidią
  • Jeśli twierdzenia AMD dotyczące RX 7900 XTX są prawdziwe, Nvidia może mieć duże kłopoty
  • AMD rozrywa topniejący adapter RTX 4090, gdy Nvidia stawia czoła pozwu zbiorowemu