Nvidia RTX DLSS: wszystko, co musisz wiedzieć

Nvidia ma dwie wyróżniające się funkcje Seria RTX 30 I Seria RTX 40 karty graficzne: ray tracing i DLSS. Zarówno PlayStation 5, jak i Xbox Series X wykonały dobrą robotę, wprowadzając większość ludzi do ray tracingu, ale DLSS wciąż jest trochę mglisty. Jest to trochę skomplikowane, ale pozwala grać w zwirtualizowaną wyższą rozdzielczość, zachowując większą szczegółowość I wyższą liczbę klatek na sekundę bez nadmiernego obciążania karty graficznej. Daje ci to, co najlepsze ze wszystkich światów, wykorzystując moc uczenia maszynowego i wprowadzając DLSS 3, technologia stała się jeszcze potężniejsza.

Zawartość

  • Co to jest DLSS?
  • Co właściwie robi DLSS?
  • Jak działa DLSS?
  • Z czasem lepiej
  • DLSS 3 odkrywa tę technologię na nowo, renderując ramki zamiast pikseli
  • DLSS kontra FSR kontra RSR kontra XeSS

Ale w tej historii jest coś więcej. Oto wszystko, co musisz wiedzieć o DLSS, o tym, jak działa i co może zrobić dla twoich gier komputerowych.

Polecane filmy

Co to jest DLSS?

logo Nvidii.

DLSS oznacza supersampling głębokiego uczenia się. Bit „supersamplingu” odnosi się do metody antyaliasingu, która wygładza postrzępione krawędzie widoczne na renderowanej grafice. Jednak w porównaniu z innymi formami antyaliasingu, SSAA (antyaliasing z superpróbkowaniem) działa poprzez renderowanie obrazu w znacznie wyższej rozdzielczości i wykorzystanie tych danych do wypełnienia luk w natywnej rozdzielczości.

Powiązany

  • Nawet partnerzy Nvidii nie wierzą w nowy RTX 4060 Ti
  • Ile pamięci RAM potrzebujesz?
  • Czy powinieneś kupić RTX 4060 lub RTX 4060 Ti firmy Nvidia?

Część „głębokiego uczenia się” to tajny sos Nvidii. Wykorzystując moc uczenia maszynowego, Nvidia może trenować modele AI za pomocą skanów w wysokiej rozdzielczości. Następnie metoda antyaliasingu może wykorzystać model AI do uzupełnienia brakujących informacji. Jest to ważne, ponieważ SSAA zwykle wymaga lokalnego renderowania obrazu o wyższej rozdzielczości. Nvidia robi to w trybie offline, z dala od komputera, zapewniając korzyści płynące z supersamplingu bez dodatkowych kosztów obliczeniowych.

NVIDIA DLSS — algorytm przetwarzania obrazu vs. Model badań AI

To wszystko jest możliwe dzięki rdzeniom Tensor firmy Nvidia, które są dostępne tylko w GPU RTX (poza rozwiązaniami data center, takimi jak Nvidię A100). Chociaż procesory graficzne z serii RTX 20 mają rdzenie Tensor, RTX 3060, 3060 Ti, 3070, 3080 i 3090 są wyposażone w rdzenie Tensor drugiej generacji firmy Nvidia, które oferują większą wydajność na rdzeń.

Najnowsze karty graficzne Nvidii z serii RTX 40 wprowadzają rdzenie Tensor do czwartej generacji. To sprawia, że ​​doładowanie DLSS jest jeszcze potężniejsze. Dzięki nowemu 8-bitowemu silnikowi tensora zmiennoprzecinkowego przepustowość rdzeni wzrosła aż pięciokrotnie w porównaniu z poprzednią generacją.

Nvidia jest liderem w tej dziedzinie, choć AMD jest nowa Funkcja superrozdzielczości FidelityFX może zapewnić ostrą konkurencję. Nawet Intel ma swoją własną technologię supersamplingu o nazwie Intel XeSSlub Intel Xe Super Sampling. Więcej na ten temat później.

Co właściwie robi DLSS?

DLSS jest wynikiem wyczerpującego procesu uczenia algorytmu sztucznej inteligencji firmy Nvidia w celu generowania lepiej wyglądających gier. Po wyrenderowaniu gry w niższej rozdzielczości DLSS pobiera informacje ze swojej bazy wiedzy trening obrazu w super rozdzielczości, aby wygenerować obraz, który nadal wygląda, jakby działał na wyższej rezolucja. Chodzi o to, aby gry renderowane w 1440p wyglądały tak, jakby działały w 4K lub gry 1080p, aby wyglądały jak 1440p. DLSS 2.0 oferuje czterokrotnie wyższą rozdzielczość, umożliwiając renderowanie gier w rozdzielczości 1080p przy jednoczesnym wyświetlaniu ich w rozdzielczości 4K.

Bardziej tradycyjne techniki superrozdzielczości mogą prowadzić do artefaktów i błędów w ostatecznym obrazie, ale DLSS został zaprojektowany do pracy z tymi błędami w celu wygenerowania jeszcze lepiej wyglądającego obrazu. W odpowiednich okolicznościach może zapewnić znaczny wzrost wydajności bez wpływu na wygląd i styl gry; wręcz przeciwnie, może sprawić, że gra będzie wyglądać jeszcze lepiej.

Gdzie takie wczesne gry DLSS Final Fantasy XV zapewnił skromną poprawę liczby klatek na sekundę z zaledwie 5 klatek na sekundę (fps) do 15 fps, nowsze wersje przyniosły znacznie większe ulepszenia. Z grami typu Dostarcz nam Księżyc I Wolfenstein: Młoda krew, Nvidia wprowadziła nowy silnik AI dla DLSS, który, jak nam powiedziano, poprawia jakość obrazu, szczególnie w niższych rozdzielczościach, takich jak 1080p, i może zwiększyć liczbę klatek na sekundę w niektórych przypadkach o ponad 50%.

Dzięki najnowszej iteracji DLSS 3 wzrost liczby klatek na sekundę może być jeszcze większy dzięki nowej funkcji generowania klatek. Poprzednie implementacje DLSS miały tylko rdzenie Tensor, które poprawiały wygląd ramek, ale teraz ramki można renderować przy użyciu samej sztucznej inteligencji. Bardziej szczegółowo omówimy DLSS 3 później.

Dostarcz nam księżyc | Zwiększenie wydajności i jakości obrazu NVIDIA DLSS

Dostępne są również nowe tryby regulacji jakości, które mogą wprowadzać użytkownicy DLSS, wybierając między wydajnością, Zrównoważony i jakościowy, z których każdy skupia moc rdzeni Tensor procesora graficznego RTX na innym aspekcie DLSS.

Jak działa DLSS?

1 z 3

DLSS 2.0 wyłączone
Wydajność DLSS 2.0
Jakość DLSS 2.0

DLSS wymusza renderowanie gry w niższej rozdzielczości (zwykle 1440p), a następnie wykorzystuje wyszkolony algorytm sztucznej inteligencji, aby wywnioskować, jak wyglądałaby, gdyby była renderowana w wyższej rozdzielczości (zwykle 4K). Robi to, wykorzystując niektóre efekty antyaliasingu (prawdopodobnie własny TAA Nvidii) i niektóre automatyczne wyostrzanie. Artefakty wizualne, które nie byłyby obecne w wyższych rozdzielczościach, są również usuwane, a nawet wykorzystywane do wnioskowania o szczegółach, które powinny być obecne na obrazie.

Jak Eurogamer wyjaśnia, algorytm sztucznej inteligencji jest szkolony, aby patrzeć na niektóre gry w ekstremalnie wysokich rozdzielczościach (podobno 64x supersampling) i jest destylowany do coś o rozmiarze zaledwie kilku megabajtów, zanim zostało dodane do najnowszych wydań sterowników Nvidii i udostępnione graczom z całego świata świat. Pierwotnie Nvidia musiała przechodzić przez ten proces w poszczególnych grach. W DLSS 2.0 Nvidia zapewnia ogólne rozwiązanie, więc modelu AI nie trzeba już trenować dla każdej gry.

W efekcie, DLSS jest wersją czasu rzeczywistego Technologia Ansel firmy Nvidia poprawiająca zrzuty ekranu. Renderuje obraz w niższej rozdzielczości, aby zwiększyć wydajność, a następnie stosuje różne efekty, aby uzyskać względnie porównywalny ogólny efekt do zwiększenia rozdzielczości.

Rezultatem może być mieszana torba, ale generalnie prowadzi to do większej liczby klatek na sekundę bez znacznej utraty wierności wizualnej. Nvidia twierdzi, że liczba klatek na sekundę może wzrosnąć nawet o 75% w Remedy Entertainment Kontrola podczas korzystania zarówno z DLSS, jak i ray tracingu. Zwykle jest mniej wyraźny i nie każdy jest fanem ostatecznego wyglądu gry DLSS, ale Opcja jest z pewnością dostępna dla tych, którzy chcą upiększyć swoje gry bez ponoszenia kosztów prowadzenia na wyższym poziomie rezolucja.

Zagubienie śmierci, zauważyliśmy znaczną poprawę w rozdzielczości 1440p w porównaniu z renderowaniem natywnym. Tryb wydajności stracił niektóre z drobniejszych szczegółów na tylnym opakowaniu, szczególnie na taśmie. Tryb jakości zachował większość szczegółów, jednocześnie wygładzając niektóre ostre krawędzie natywnego renderowania. Nasz zrzut ekranu „DLSS off” pokazuje jakość bez wygładzania krawędzi. Chociaż DLSS nie utrzymuje tego poziomu jakości, jest bardzo skuteczny w zwalczaniu aliasingu przy zachowaniu większości szczegółów.

Nie zauważyliśmy żadnego nadmiernego wyostrzenia Zagubienie śmierci, ale to coś, co możesz napotkać podczas korzystania z DLSS.

Z czasem lepiej

DLSS ma potencjał, aby dać graczom, którzy nie mogą osiągnąć wygodnej liczby klatek na sekundę w rozdzielczościach powyżej 1080p, możliwość zrobienia tego na podstawie wnioskowania. DLSS jest z pewnością jedną z najpotężniejszych funkcji procesorów graficznych RTX. Nie są tak potężne, jak moglibyśmy się spodziewać, a efekty śledzenia promieni są ładne, ale zwykle mają spory wpływ na wydajność, ale DLSS daje nam to, co najlepsze z obu światów: lepiej wyglądające gry, które też działają lepiej.

Początkowo wydawało się, że DLSS będzie niszową funkcją dla kart graficznych z niższej półki, ale tak nie jest. Zamiast tego DLSS umożliwił gry takie jak Cyberpunka 2077 Kontrola aby zwiększyć wierność wizualną na wysokiej klasy sprzęcie bez uniemożliwiania grania w gry. DLSS podnosi poziom sprzętu z niższej półki, jednocześnie zapewniając wgląd w przyszłość sprzętu z wyższej półki.

Nvidia pokazała gry renderujące RTX 3090, takie jak Wolfenstein: Młoda krew w 8K z włączonym ray tracingiem i DLSS. Chociaż szerokie przyjęcie 8K jest wciąż odległe, wyświetlacze 4K stają się coraz bardziej powszechne. Zamiast renderowania w natywnej rozdzielczości 4K i mając nadzieję na utrzymanie około 50 fps do 60 fps, gracze mogą renderować w rozdzielczości 1080p lub 1440p i użyć DLSS do uzupełnienia brakujących informacji. Rezultatem jest wyższa liczba klatek na sekundę bez zauważalnej utraty jakości obrazu.

DLSS również cały czas się poprawia i otrzymuje regularne aktualizacje w celu ulepszenia algorytmu AI. Pozwala teraz na inteligentniejsze wykorzystanie wektorów ruchu, co zasadniczo pomaga poprawić wygląd poruszających się obiektów. Aktualizacja zmniejsza również zjawy, sprawia, że ​​efekty cząsteczkowe są wyraźniejsze i poprawia stabilność czasową. DLSS 2 jest obecnie dość powszechnie stosowany, a od września 2022 r. obsługuje go 216 gier.

Jednak ulepszenia na tym się nie kończą. W rzeczywistości sytuacja stanie się o wiele bardziej interesująca wraz z wprowadzeniem DLSS 3.

DLSS 3 odkrywa tę technologię na nowo, renderując ramki zamiast pikseli

Porównanie jakości grafiki bez i z DLSS 3.
Nvidia

20 września podczas swojego przemówienia na GTC 2022, Nvidia zapowiedziała DLSS 3 — najnowszą iterację technologii, która będzie dostępna dla posiadaczy kart graficznych z serii RTX 40. W przeciwieństwie do niektórych poprzednich, mniejszych aktualizacji, tym razem zmiany w DLSS są duże i mogą zaoferować ogromny wzrost wydajności dzięki dodaniu klatek generowanych przez sztuczną inteligencję, które są tworzone przy użyciu prawdziwych klatek GPU renderuje. To bardzo różni się od DLSS i DLSS 2, które właśnie poprawiły prawdziwe klatki dzięki skalowaniu w górę opartemu na sztucznej inteligencji.

Obecnie istnieją cztery procesory graficzne obsługujące DLSS 3:

  • RTX4090
  • RTX4080
  • RTX 4070Ti
  • RTX4070

W naszej recenzji RTX 4090stwierdziliśmy, że DLSS 3 był w stanie zapewnić znacznie wyższą liczbę klatek na sekundę niż DLSS 2. W Cyberpunka 2077 przy 4K z ray tracingiem ustawionym na maksimum, włączenie DLSS 3 dało prawie 50% więcej klatek niż samo użycie DLSS 2; w porównaniu z całkowitym brakiem DLSS, DLSS 3 miał ponad trzykrotnie większą liczbę klatek na sekundę. Pod tym względem DLSS 3 zapewnia dokładnie to, co obiecała Nvidia.

Wydajność DLSS 3 w Cyberpunk 2077 z RTX 4090.

Istnieją jednak pewne ograniczenia techniczne związane z DLSS 3. Zasadniczo DLSS wstawia ramkę wygenerowaną przez sztuczną inteligencję pomiędzy dwie rzeczywiste ramki, a ta ramka AI jest rysowana na podstawie różnic między dwiema rzeczywistymi ramkami. Oczywiście oznacza to, że GPU nie może pokazać drugiej rzeczywistej klatki, zanim zobaczysz klatkę wygenerowaną przez sztuczną inteligencję, dlatego opóźnienie jest o wiele większe w przypadku DLSS 3. To powód dlaczego Nvidia Reflex musi być również włączony, aby działał DLSS 3.

Inne główne ograniczenie DLSS 3 wynika po prostu z generowanych przez sztuczną inteligencję ramek z błędami i dziwnymi błędami wizualnymi. W naszych testach stwierdziliśmy, że po włączeniu DLSS 3 nastąpił ogólny spadek jakości, co łatwo przeoczyć, gdy wzrost liczby klatek na sekundę jest tak wysoki, ale niektóre problemy z jakością są trudne do zignorowania. W szczególności elementy interfejsu użytkownika lub HUD są zniekształcone w ramkach generowanych przez sztuczną inteligencję, prawdopodobnie dlatego, że sztuczna inteligencja jest nastawiona na środowiska 3D, a nie tekst 2D, który znajduje się na samej grze. DLSS 2 nie ma tego problemu, ponieważ interfejs użytkownika jest renderowany niezależnie od elementów 3D, w przeciwieństwie do DLSS 3.

Poniżej zrzut ekranu z Cyberpunka 2077 porównanie DLSS 3, DLSS 2 i natywnej rozdzielczości od lewej do prawej. Jeśli chodzi o środowisko, obie implementacje DLSS są lepsze niż natywne, ale można zobacz także, że na zrzucie ekranu DLSS 3 po lewej stronie znacznik zadania jest zniekształcony, podobnie jak tekst nieczytelne. Zwykle dzieje się tak w przypadku klatek generowanych przez sztuczną inteligencję w grach z DLSS 3.

DLSS 3 w Cyberpunku 2077.

Z jednej strony DLSS 3 przesuwa klatki jeszcze wyżej i zwykle nie ma znacznie gorszej jakości wizualnej niż DLSS 2. Ale z drugiej strony włączenie DLSS 3 powoduje, że opóźnienie jest bardzo wysokie w stosunku do liczby klatek na sekundę i może wprowadzać dziwne błędy wizualne, zwłaszcza w elementach interfejsu użytkownika i interfejsu. Obniżenie opóźnień i redukcja artefaktów wizualnych będzie niewątpliwie wyzwaniem dla Nvidii, ponieważ są to podstawowe kompromisy związane z DLSS 3. Jednak w przypadku technologii pierwszej generacji jest to dobra pierwsza próba i miejmy nadzieję, że Nvidia będzie w stanie poprawić sytuację dzięki przyszłym iteracjom DLSS 3.

DLSS 3 powoli wkracza do większej liczby gier. Oto tytuły, które obecnie obsługują DLSS 3:

  • Opowieść o zarazie: Requiem
  • Atomowe Serce
  • Jasna pamięć: nieskończona
  • Czarnobylit
  • Ostrze Zdobywcy
  • Cyberpunka 2077
  • Wybaw nas Marsie
  • Zniszcz wszystkich ludzi 2
  • Umierające światło 2
  • F1 22
  • PIĘŚĆ: Wykuta w pochodni cienia
  • Zabójca 3
  • Dziedzictwo Hogwartu
  • Ikar
  • Jurassic World Evolution 2
  • Sprawiedliwość
  • Loopman
  • Huncwoci
  • Marvel's Spider-Man Remastered
  • Microsoft Flight Simulator
  • Polowanie na duchy o północy
  • Mount and Blade 2 Bannerlord
  • Naraka Bladepoint
  • Portal RTX
  • Wypruć
  • Wiedźmin 3 Dziki Gon
  • Warhammer 40,000 Darktide

DLSS kontra FSR kontra RSR kontra XeSS

Szefowie Nvidii i AMD obok siebie.

AMD jest największym konkurentem Nvidii, jeśli chodzi o technologię graficzną. Aby konkurować z DLSS, AMD wydany FidelityFX Super Resolution (FSR) w 2021 r. Chociaż osiąga ten sam cel, jakim jest poprawa efektów wizualnych przy jednoczesnym zwiększeniu liczby klatek na sekundę, FSR działa zupełnie inaczej niż DLSS. FSR renderuje klatki w niższej rozdzielczości, a następnie wykorzystuje algorytm skalowania przestrzennego typu open source sprawiają, że gra wygląda tak, jakby działała w wyższej rozdzielczości i nie uwzględniała wektora ruchu dane. DLSS wykorzystuje algorytm sztucznej inteligencji, aby zapewnić te same wyniki, ale ta technika jest obsługiwana tylko przez własne procesory graficzne RTX firmy Nvidia. Z drugiej strony FSR może działać na prawie każdym GPU.

AMD FidelityFX Super Resolution: Superdoładowana wydajność

Oprócz FSR, AMD ma również Radeon Super Resolution (RSR), która jest techniką skalowania przestrzennego wykorzystującą sztuczną inteligencję. Chociaż brzmi to podobnie do DLSS, istnieją różnice. RSR jest zbudowany przy użyciu tego samego algorytmu, co FidelityFX Super Resolution (FSR) i jest funkcją opartą na sterowniku, która jest dostarczana za pośrednictwem oprogramowania AMD Adrenalin. RSR ma na celu wypełnienie luki, w której FSR nie jest dostępny, ponieważ ten ostatni musi zostać zaimplementowany bezpośrednio w określonych grach. Zasadniczo RSR powinien działać w prawie każdej grze, ponieważ nie wymaga implementacji go przez programistów. Warto zauważyć, że FSR jest dostępny w nowszych procesorach graficznych Nvidia i AMD, a RSR z drugiej strony jest kompatybilny tylko z kartami RDNA AMD, w tym Radeon RX 5000 i serii RX6000. Wkrótce ten skład zostanie poszerzony o m.in RDNA 3 i jego procesory graficzne z serii Radeon RX 7000.

Intel pracuje również nad własną technologią supersamplingu, tzw Superpróbkowanie Xe (XeSS)iw przeciwieństwie do FSR lub DLSS dostępne są dwie różne wersje. Pierwszy wykorzystuje jednostki matematyczne macierzy XMX, które są obecne w jego nowym GPU Arc Alchemist; te jednostki XMX zajmują się całym przetwarzaniem AI po stronie sprzętowej. Druga wersja wykorzystuje powszechnie akceptowaną instrukcję czteroelementowego iloczynu wektorowego (DP4a), usuwając w ten sposób zależność od własnego sprzętu Intela i umożliwiając XeSS pracę na Nvidii i AMD GPU.

Zalecenia redaktorów

  • Czy Nvidia właśnie naprawiła topiące się złącza zasilania RTX 4090?
  • RTX 4060 Ti 16 GB zostanie wprowadzony na rynek 18 lipca pośród desperackich obniżek cen
  • Co to jest pamięć RAM? Oto wszystko, co musisz wiedzieć
  • Co to jest GDDR7? Wszystko, co musisz wiedzieć o nowej generacji pamięci VRAM
  • Przetestowałem nowy RTX 4060 Nvidii przeciwko RX 7600 — i nie jest ładny