Nvidia RTX DLSS: alt hvad du behøver at vide

Nvidia har to iøjnefaldende funktioner RTX 30-serien og RTX 40-serien grafikkort: ray tracing og DLSS. PlayStation 5 og Xbox Series X har begge gjort et godt stykke arbejde med at introducere de fleste mennesker til ray tracing, men DLSS er stadig lidt tåget. Det er lidt komplekst, men det giver dig mulighed for at spille et spil i en virtualiseret højere opløsning og bevare større detaljer og højere billedhastigheder uden at beskatte dit grafikkort så meget. Det giver dig det bedste fra alle verdener ved at udnytte kraften ved maskinlæring og med introduktionen af DLSS 3, teknologien er lige blevet endnu mere kraftfuld.

Indhold

  • Hvad er DLSS?
  • Hvad gør DLSS egentlig?
  • Hvordan virker DLSS?
  • Bedre med tiden
  • DLSS 3 genopfinder teknologien ved at gengive rammer i stedet for pixels
  • DLSS versus FSR versus RSR versus XeSS

Men der er lidt mere i historien end det. Her er alt, hvad du behøver at vide om DLSS, hvordan det virker, og hvad det kan gøre for dine pc-spil.

Anbefalede videoer

Hvad er DLSS?

Nvidia logo.

DLSS står for deep learning supersampling. "Supersampling"-bitten refererer til en anti-aliasing-metode, der udglatter de takkede kanter, der vises på gengivet grafik. I forhold til andre former for anti-aliasing fungerer SSAA (supersampling anti-aliasing) dog ved at gengive billedet i en meget højere opløsning og bruge disse data til at udfylde hullerne ved den oprindelige opløsning.

Relaterede

  • Selv Nvidias partnere tror ikke på den nye RTX 4060 Ti
  • Hvor meget RAM har du brug for?
  • Skal du købe Nvidias RTX 4060 eller RTX 4060 Ti?

"Deep learning"-delen er Nvidias hemmelige sauce. Ved at bruge kraften i maskinlæring kan Nvidia træne AI-modeller med højopløselige scanninger. Derefter kan anti-aliasing-metoden bruge AI-modellen til at udfylde de manglende oplysninger. Dette er vigtigt, da SSAA normalt kræver, at du gengiver billedet med højere opløsning lokalt. Nvidia gør det offline, væk fra din computer, hvilket giver fordelene ved supersampling uden computeromkostninger.

NVIDIA DLSS - Billedbehandlingsalgoritme vs. AI-forskningsmodel

Alt dette er muligt takket være Nvidias Tensor-kerner, som kun er tilgængelige i RTX GPU'er (uden for datacenterløsninger, som f.eks. Nvidia A100). Selvom RTX 20-seriens GPU'er har Tensor-kerner indeni, kommer RTX 3060, 3060 Ti, 3070, 3080 og 3090 med Nvidias andengenerations Tensor-kerner, som tilbyder større per-core ydeevne.

Nvidias nyeste grafikkort fra RTX 40-serien bringer Tensor-kernerne op til deres fjerde generation. Dette gør DLSS boost endnu mere kraftfuldt. Takket være den nye 8-bit floating point tensormotor har kernerne fået deres gennemløb øget med så meget som fem gange i forhold til den forrige generation.

Nvidia fører an på dette område, selvom AMD er nyt FidelityFX Super Resolution funktion kunne give hård konkurrence. Selv Intel har sin egen supersampling teknologi kaldet Intel XeSS, eller Intel Xe Super Sampling. Mere om det senere.

Hvad gør DLSS egentlig?

DLSS er resultatet af en udtømmende proces med at lære Nvidias AI-algoritme til at generere flottere spil. Efter at have gengivet spillet med en lavere opløsning, udleder DLSS information fra sin videnbase om super-opløsning billedtræning for at generere et billede, der stadig ser ud som om det kørte på et højere niveau løsning. Ideen er at få spil gengivet ved 1440p til at se ud som om de kører på 4K eller 1080p spil til at ligne 1440p. DLSS 2.0 tilbyder fire gange opløsningen, hvilket giver dig mulighed for at gengive spil ved 1080p, mens du udsender dem i 4K.

Mere traditionelle superopløsningsteknikker kan føre til artefakter og fejl i det endelige billede, men DLSS er designet til at arbejde med disse fejl for at generere et endnu bedre udseende billede. Under de rigtige omstændigheder kan det levere betydelige præstationsforøgelser uden at påvirke udseendet og følelsen af ​​et spil; tværtimod kan det få spillet til at se endnu bedre ud.

Hvor tidlige DLSS-spil kan lide Final Fantasy XV leverede beskedne billedhastighedsforbedringer på kun 5 billeder i sekundet (fps) til 15 fps, nyere udgivelser har set langt større forbedringer. Med spil som Befri os Månen og Wolfenstein: Youngblood, introducerede Nvidia en ny AI-motor til DLSS, som vi får at vide forbedrer billedkvaliteten, især ved lavere opløsninger som 1080p, og kan øge billedhastigheden i nogle tilfælde med over 50 %.

Med den seneste iteration af DLSS 3 kan billedhastighedsstigningerne være endnu mere betydelige takket være den nye frame-generationsfunktion. Tidligere implementeringer af DLSS havde netop Tensor-kernerne til at få frames til at se bedre ud, men nu kan frames gengives kun ved hjælp af AI. Vi vil diskutere DLSS 3 mere detaljeret senere.

Lever os månen | NVIDIA DLSS-ydeevne og billedkvalitetsboost

Der er også nye kvalitetsjusteringstilstande, som DLSS-brugere kan lave ved at vælge mellem ydeevne, Afbalanceret og kvalitet, der hver især fokuserer RTX GPU's Tensor-kernehestekræfter på et andet aspekt af DLSS.

Hvordan virker DLSS?

1 af 3

DLSS 2.0 fra
DLSS 2.0 ydeevne
DLSS 2.0 kvalitet

DLSS tvinger et spil til at gengives ved en lavere opløsning (typisk 1440p) og bruger derefter sin trænede AI-algoritme til at udlede, hvordan det ville se ud, hvis det blev gengivet i en højere (typisk 4K). Det gør det ved at bruge nogle anti-aliasing-effekter (sandsynligvis Nvidias egen TAA) og noget automatiseret skærpning. Visuelle artefakter, der ikke ville være til stede i højere opløsninger, bliver også udslettet og endda brugt til at udlede de detaljer, der burde være til stede i et billede.

Som Eurogamer forklarer, AI-algoritmen er trænet til at se på visse spil i ekstremt høje opløsninger (angiveligt 64x supersampling) og er destilleret ned til noget, der kun er et par megabyte i størrelse, før det bliver føjet til de nyeste Nvidia-driverudgivelser og gjort tilgængeligt for spillere overalt på verden. Oprindeligt skulle Nvidia gennemgå denne proces spil for spil. I DLSS 2.0 giver Nvidia en generel løsning, så AI-modellen ikke længere skal trænes til hvert spil.

Faktisk er DLSS en realtidsversion af Nvidias screenshot-forbedrende Ansel-teknologi. Det gengiver billedet med en lavere opløsning for at give et ydelsesboost, og anvender derefter forskellige effekter for at levere en relativt sammenlignelig samlet effekt til at hæve opløsningen.

Resultatet kan være en blandet sag, men generelt fører det til højere billedhastigheder uden et væsentligt tab i visuel troskab. Nvidia hævder, at billedhastigheder kan forbedres med så meget som 75% i Remedy Entertainment's Styring ved brug af både DLSS og ray tracing. Det er normalt mindre udtalt end som så, og ikke alle er fan af det endelige udseende af et DLSS-spil, men mulighed er helt sikkert der for dem, der ønsker at forskønne deres spil uden omkostningerne ved at køre på en højere løsning.

Death Stranding, vi så betydelige forbedringer ved 1440p i forhold til native gengivelse. Performance mode mistede nogle af de finere detaljer på bagpakken, især i tapen. Kvalitetstilstand bibeholdt de fleste detaljer, mens de udglattede nogle af de ru kanter af den oprindelige gengivelse. Vores "DLSS off"-skærmbillede viser kvaliteten uden anti-aliasing. Selvom DLSS ikke opretholder det kvalitetsniveau, er det meget effektivt til at bekæmpe aliasing og samtidig bevare de fleste detaljer.

Vi så ikke nogen overskærpning Death Stranding, men det er noget, du kan støde på, mens du bruger DLSS.

Bedre med tiden

DLSS har potentialet til at give spillere, der ikke helt kan nå komfortable billedhastigheder ved opløsninger over 1080p, muligheden for at gøre det med inferens. DLSS er bestemt en af ​​de mest kraftfulde funktioner i RTX GPU'erne. De er ikke så kraftige, som vi måske havde håbet, og strålesporingseffekterne er smukke, men har en tendens til at have en betydelig indflydelse på ydeevnen, men DLSS giver os det bedste fra begge verdener: flottere spil, der også yder bedre.

Oprindeligt så det ud til, at DLSS ville være en nichefunktion til low-end grafikkort, men det er ikke tilfældet. I stedet har DLSS aktiveret spil som f.eks Cyberpunk 2077 og Styring at skubbe visuel troskab på avanceret hardware uden at gøre spillene uspillelige. DLSS løfter low-end hardware og giver samtidig et indblik i fremtiden for high-end hardware.

Nvidia har vist RTX 3090-gengivelsesspil som Wolfenstein: YoungBlood ved 8K med ray tracing og DLSS slået til. Selvom bred anvendelse af 8K stadig er langt væk, bliver 4K-skærme stadig mere almindelige. I stedet for at gengive i native 4K og håbe på at holde omkring 50 fps til 60 fps, kan spillere gengive ved 1080p eller 1440p og bruge DLSS til at udfylde de manglende oplysninger. Resultatet er højere billedhastigheder uden mærkbart tab i billedkvalitet.

DLSS forbedres også hele tiden, og den modtager regelmæssige opdateringer i et forsøg på at forbedre AI-algoritmen. Det giver den nu mulighed for at gøre smartere brug af bevægelsesvektorer, hvilket i det væsentlige hjælper med at forbedre, hvordan objekter ser ud, når de bevæger sig. Opdateringen reducerer også ghosting, får partikeleffekter til at se klarere ud og forbedrer tidsmæssig stabilitet. DLSS 2 er nu ret udbredt, og 216 spil understøtter det fra september 2022.

Forbedringerne stopper dog ikke der. Faktisk er tingene ved at blive meget mere interessante med introduktionen af ​​DLSS 3.

DLSS 3 genopfinder teknologien ved at gengive rammer i stedet for pixels

En sammenligning mellem grafikkvaliteten uden DLSS 3 og med den.
Nvidia

Den 20. september under sin GTC 2022 keynote, Nvidia annoncerede DLSS 3 — den seneste iteration af teknologien, der vil være tilgængelig for ejerne af RTX 40-seriens grafikkort. I modsætning til nogle af de tidligere, mindre opdateringer, er ændringerne til DLSS store denne gang, og de har potentialet til at tilbyde en enorm stigning i ydeevnen med tilføjelsen af ​​AI-genererede rammer, som er skabt ved hjælp af de rigtige rammer, som en GPU gengiver. Dette er meget forskelligt fra DLSS og DLSS 2, som netop har forbedret rigtige frames med AI-drevet opskalering.

Der er i øjeblikket fire GPU'er, der understøtter DLSS 3:

  • RTX 4090
  • RTX 4080
  • RTX 4070 Ti
  • RTX 4070

I vores RTX 4090 anmeldelse, fandt vi ud af, at DLSS 3 var i stand til at levere betydeligt højere billedhastigheder end DLSS 2. I Cyberpunk 2077 ved 4K med ray tracing indstillet til max, gav aktivering af DLSS 3 næsten 50 % flere billeder end blot at bruge DLSS 2; sammenlignet med slet ikke at bruge DLSS, havde DLSS 3 over tre gange så mange billedhastigheder. I dette aspekt leverer DLSS 3 præcis som Nvidia lovede.

DLSS 3 ydeevne i Cyberpunk 2077 med RTX 4090.

Der er dog nogle tekniske begrænsninger med DLSS 3. Grundlæggende indsætter DLSS en AI-genereret ramme mellem to rigtige frames, og den AI-ramme er tegnet ud fra forskellene mellem de to rigtige frames. Det betyder naturligvis, at GPU'en ikke kan vise dig den anden rigtige ramme, før du ser den AI-genererede ramme, hvilket er grunden til, at latensen er så meget højere med DLSS 3. Dette er grunden til Nvidia refleks skal også være aktiveret for at DLSS 3 kan fungere.

Den anden store begrænsning ved DLSS 3 er simpelthen ned til AI-genererede rammer, der har fejl og mærkelige visuelle fejl. I vores test fandt vi ud af, at der var et generelt kvalitetsfald ved aktivering af DLSS 3, som er let at overse, når billedhastighedsforøgelsen er så høj, men nogle kvalitetsproblemer er svære at ignorere. Især UI- eller HUD-elementer bliver forvansket i de AI-genererede rammer, formentlig fordi AI'en er rettet mod 3D-miljøer og ikke 2D-tekst, der er oven på selve spillet. DLSS 2 har ikke dette problem, fordi brugergrænsefladen gengives uafhængigt af 3D-elementerne i modsætning til DLSS 3.

Nedenfor er et skærmbillede fra Cyberpunk 2077 sammenligner DLSS 3, DLSS 2 og native opløsning fra venstre mod højre. Når det kommer til miljøet, er begge implementeringer af DLSS bedre end den oprindelige, men du kan se også, at i DLSS 3-skærmbilledet til venstre er quest-markøren forvrænget, og teksten er ulæselig. Dette er normalt, hvad der sker i AI-genererede frames i spil, der har DLSS 3.

DLSS 3 i Cyberpunk 2077.

På den ene side skubber DLSS 3 frames endnu højere og har normalt ikke meget dårligere visuel kvalitet end DLSS 2. Men på den anden side forårsager aktivering af DLSS 3, at latensen er meget høj i forhold til billedhastigheden og kan introducere underlige visuelle fejl, især på UI- og HUD-elementer. At sænke latens og reducere visuelle artefakter vil utvivlsomt være en udfordring for Nvidia, da disse er grundlæggende afvejninger, der følger med DLSS 3. For en førstegenerationsteknologi er det dog et godt første forsøg, og forhåbentlig vil Nvidia være i stand til at forbedre tingene med fremtidige iterationer af DLSS 3.

DLSS 3 er langsomt på vej ind i flere spil. Her er de titler, der i øjeblikket understøtter DLSS 3:

  • A Plague Tale: Requiem
  • Atomisk hjerte
  • Lys hukommelse: Uendelig
  • Tjernobylite
  • Conqueror's Blade
  • Cyberpunk 2077
  • Befri os Mars
  • Ødelæg alle mennesker 2
  • Døende lys 2
  • F1 22
  • Næve: Smedet i Shadow Torch
  • Hitman 3
  • Hogwarts arv
  • Icarus
  • Jurassic World Evolution 2
  • Retfærdighed
  • Loopmancer
  • Marauders
  • Marvel's Spider-Man remasteret
  • Microsoft Flight Simulator
  • Midnatspøgelsesjagt
  • Mount and Blade 2 Bannerlord
  • Naraka Bladepoiint
  • Portal RTX
  • Rive ud
  • The Witcher 3 Wild Hunt
  • Warhammer 40.000 Darktide

DLSS versus FSR versus RSR versus XeSS

Nvidia og AMD's administrerende direktører side om side.

AMD er Nvidias største konkurrent, når det kommer til grafikteknologi. For at konkurrere med DLSS, AMD frigivet FidelityFX Super Resolution (FSR) i 2021. Selvom det opnår det samme mål om at forbedre det visuelle og samtidig øge billedhastigheden, fungerer FSR helt anderledes end DLSS. FSR gengiver frames med en lavere opløsning og bruger derefter en open source rumlig opskaleringsalgoritme til at få spillet til at se ud som om det kører med en højere opløsning og ikke tager højde for bevægelsesvektor data. DLSS bruger en AI-algoritme til at levere de samme resultater, men denne teknik understøttes kun af Nvidias egne RTX GPU'er. FSR, på den anden side, kan arbejde på næsten enhver GPU.

AMD FidelityFX Super opløsning: Superladet ydeevne

Udover FSR har AMD også Radeon Super Resolution (RSR), som er en rumlig opskaleringsteknik, der gør brug af AI. Selvom dette lyder som DLSS, er der forskelle. RSR er bygget ved hjælp af samme algoritme som FidelityFX Super Resolution (FSR) og er en driver-baseret funktion, der leveres via AMDs Adrenalin-software. RSR sigter mod at udfylde hullet, hvor FSR ikke er tilgængeligt, da sidstnævnte skal implementeres direkte i specifikke spil. Grundlæggende burde RSR fungere i næsten ethvert spil, da det ikke kræver, at udviklere implementerer det. FSR er især tilgængelig på tværs af nyere Nvidia og AMD GPU'er, og RSR er på den anden side kun kompatibel med AMD's RDNA-kort, som inkluderer Radeon RX 5000 og RX 6000-serien. Snart vil det lineup blive udvidet til at omfatte RDNA 3 og dens Radeon RX 7000-serie GPU'er.

Intel har også arbejdet på sin egen supersampling-teknologi kaldet Xe Super Sampling (XeSS), og i modsætning til med FSR eller DLSS, er der to forskellige versioner tilgængelige. Den første gør brug af XMX matrix matematiske enheder, som er til stede i dens nye Arc Alchemist GPU'er; disse XMX-enheder tager sig af al AI-behandling i hardwareenden. Den anden version gør brug af den bredt accepterede fire-element vektor prik produkt (DP4a) instruktion, dermed fjerne afhængigheden fra Intels egen hardware og tillade XeSS at arbejde på Nvidia og AMD GPU'er.

Redaktørens anbefalinger

  • Har Nvidia lige rettet RTX 4090's smeltende strømstik?
  • RTX 4060 Ti 16GB lanceres den 18. juli midt i desperate prisnedsættelser
  • Hvad er RAM? Her er alt, hvad du behøver at vide
  • Hvad er GDDR7? Alt hvad du behøver at vide om næste generations VRAM
  • Jeg testede Nvidias nye RTX 4060 mod RX 7600 - og det er ikke kønt