Nvidia RTX DLSS: tudo o que você precisa saber

A Nvidia tem dois recursos de destaque em seu série RTX 30 e série RTX 40 placas gráficas: ray tracing e DLSS. O PlayStation 5 e o Xbox Series X fizeram um bom trabalho ao apresentar o ray tracing para a maioria das pessoas, mas o DLSS ainda é um pouco nebuloso. É um pouco complexo, mas permite que você jogue em uma resolução virtualizada maior, mantendo maior detalhe e taxas de quadros mais altas sem sobrecarregar tanto sua placa gráfica. Ele oferece o melhor de todos os mundos, aproveitando o poder do aprendizado de máquina e com a introdução de DLSS 3, a tecnologia ficou ainda mais poderosa.

Conteúdo

  • O que é DLSS?
  • O que o DLSS realmente faz?
  • Como funciona o DLSS?
  • Melhor com o tempo
  • DLSS 3 reinventa a tecnologia renderizando quadros em vez de pixels
  • DLSS versus FSR versus RSR versus XeSS

Mas há um pouco mais na história do que isso. Aqui está tudo o que você precisa saber sobre o DLSS, como ele funciona e o que ele pode fazer pelos seus jogos de PC.

Vídeos recomendados

O que é DLSS?

logotipo da Nvidia.

DLSS significa deep learning supersampling. O bit “supersampling” refere-se a um método anti-aliasing que suaviza as bordas irregulares que aparecem nos gráficos renderizados. Sobre outras formas de anti-aliasing, no entanto, o SSAA (supersampling anti-aliasing) funciona renderizando a imagem em uma resolução muito maior e usando esses dados para preencher as lacunas na resolução nativa.

Relacionado

  • Nem os parceiros da Nvidia acreditam na nova RTX 4060 Ti
  • Quanta RAM você precisa?
  • Você deve comprar o RTX 4060 ou o RTX 4060 Ti da Nvidia?

A parte de “aprendizagem profunda” é o molho secreto da Nvidia. Usando o poder do aprendizado de máquina, a Nvidia pode treinar modelos de IA com varreduras de alta resolução. Em seguida, o método anti-aliasing pode usar o modelo AI para preencher as informações que faltam. Isso é importante, pois o SSAA geralmente exige que você renderize a imagem de resolução mais alta localmente. A Nvidia faz isso offline, longe do seu computador, fornecendo os benefícios da superamostragem sem a sobrecarga de computação.

NVIDIA DLSS - Algoritmo de processamento de imagem vs. Modelo de pesquisa de IA

Tudo isso é possível graças aos núcleos Tensor da Nvidia, disponíveis apenas em GPUs RTX (fora das soluções de data center, como o Nvidia A100). Embora as GPUs da série RTX 20 tenham núcleos Tensor internos, as RTX 3060, 3060 Ti, 3070, 3080 e 3090 vêm com os núcleos Tensor de segunda geração da Nvidia, que oferecem maior desempenho por núcleo.

As mais novas placas gráficas da Nvidia da linha RTX 40-Series trazem os núcleos Tensor para sua quarta geração. Isso torna o aumento do DLSS ainda mais poderoso. Graças ao novo mecanismo tensor de ponto flutuante de 8 bits, os núcleos tiveram sua taxa de transferência aumentada em até cinco vezes em comparação com a geração anterior.

A Nvidia está liderando o ataque nessa área, embora a nova tecnologia da AMD Recurso de super resolução FidelityFX poderia fornecer alguma competição acirrada. Até a Intel tem sua própria tecnologia de supersampling chamada Intel XeSS, ou Intel Xe Super Sampling. Mais sobre isso mais tarde.

O que o DLSS realmente faz?

O DLSS é o resultado de um processo exaustivo de ensino do algoritmo de IA da Nvidia para gerar jogos com melhor aparência. Depois de renderizar o jogo em uma resolução mais baixa, o DLSS infere informações de sua base de conhecimento de treinamento de imagem de super-resolução para gerar uma imagem que ainda parece estar sendo executada em uma velocidade mais alta resolução. A ideia é fazer com que os jogos renderizados em 1440p pareçam estar rodando em 4K ou 1080p para parecerem 1440p. O DLSS 2.0 oferece quatro vezes a resolução, permitindo que você renderize jogos em 1080p enquanto os reproduz em 4K.

Técnicas de super-resolução mais tradicionais podem levar a artefatos e bugs na imagem final, mas o DLSS foi projetado para trabalhar com esses erros para gerar uma imagem ainda melhor. Nas circunstâncias certas, pode oferecer aumentos substanciais de desempenho sem afetar a aparência de um jogo; pelo contrário, pode tornar o jogo ainda melhor.

Onde os primeiros jogos DLSS como Final Fantasy XV entregou melhorias modestas na taxa de quadros de apenas 5 quadros por segundo (fps) para 15 fps, as versões mais recentes tiveram melhorias muito maiores. Com jogos como Entregue-nos a lua e Wolfenstein: Youngblood, a Nvidia introduziu um novo mecanismo de IA para DLSS, que, segundo dizem, melhora a qualidade da imagem, especialmente em resoluções mais baixas, como 1080p, e pode aumentar as taxas de quadros em alguns casos em mais de 50%.

Com a mais recente iteração do DLSS 3, os ganhos na taxa de quadros podem ser ainda mais substanciais graças ao novo recurso de geração de quadros. As implementações anteriores do DLSS tinham apenas os núcleos do Tensor para melhorar a aparência dos quadros, mas agora os quadros podem ser renderizados usando apenas IA. Discutiremos o DLSS 3 com mais detalhes posteriormente.

Entregue-nos a Lua | Aumento de desempenho e qualidade de imagem do NVIDIA DLSS

Existem também novos modos de ajuste de qualidade que os usuários do DLSS podem fazer, escolhendo entre Desempenho, Equilibrado e Qualidade, cada um focando a potência do núcleo Tensor da GPU RTX em um aspecto diferente de DLSS.

Como funciona o DLSS?

1 de 3

DLSS 2.0 desativado
Desempenho DLSS 2.0
Qualidade DLSS 2.0

O DLSS força um jogo a renderizar em uma resolução mais baixa (normalmente 1440p) e, em seguida, usa seu algoritmo de IA treinado para inferir como seria se fosse renderizado em uma resolução mais alta (normalmente 4K). Ele faz isso utilizando alguns efeitos anti-aliasing (provavelmente o próprio TAA da Nvidia) e alguma nitidez automatizada. Artefatos visuais que não estariam presentes em resoluções mais altas também são eliminados e até usados ​​para inferir os detalhes que deveriam estar presentes em uma imagem.

Como Eurogamer explica, o algoritmo AI é treinado para olhar para certos jogos em resoluções extremamente altas (supostamente 64x supersampling) e é destilado para baixo para algo com apenas alguns megabytes de tamanho antes de ser adicionado aos últimos lançamentos de driver da Nvidia e disponibilizado para jogadores de todo o mundo mundo. Originalmente, a Nvidia tinha que passar por esse processo jogo a jogo. No DLSS 2.0, a Nvidia oferece uma solução geral, de modo que o modelo de IA não precisa mais ser treinado para cada jogo.

Na verdade, o DLSS é uma versão em tempo real do Tecnologia Ansel de aprimoramento de captura de tela da Nvidia. Ele renderiza a imagem em uma resolução mais baixa para fornecer um aumento de desempenho e, em seguida, aplica vários efeitos para fornecer um efeito geral relativamente comparável ao aumento da resolução.

O resultado pode ser confuso, mas, em geral, leva a taxas de quadros mais altas sem perda substancial de fidelidade visual. Nvidia afirma que as taxas de quadros podem melhorar em até 75% no Remedy Entertainment Ao controle ao usar o DLSS e o traçado de raios. Geralmente é menos pronunciado do que isso, e nem todo mundo é fã da aparência final de um jogo DLSS, mas o opção certamente existe para aqueles que querem embelezar seus jogos sem o custo de correr em um maior resolução.

Em encalhe da morte, vimos melhorias significativas em 1440p em relação à renderização nativa. O modo de desempenho perdeu alguns dos detalhes mais sutis na embalagem traseira, principalmente na fita. O modo de qualidade manteve a maior parte dos detalhes enquanto suavizava algumas das arestas da renderização nativa. Nossa captura de tela “DLSS off” mostra a qualidade sem qualquer anti-aliasing. Embora o DLSS não mantenha esse nível de qualidade, é muito eficaz no combate ao aliasing, mantendo a maior parte dos detalhes.

Não vimos nenhum excesso de nitidez em encalhe da morte, mas isso é algo que você pode encontrar ao usar o DLSS.

Melhor com o tempo

O DLSS tem o potencial de oferecer aos jogadores que não conseguem atingir taxas de quadros confortáveis ​​em resoluções acima de 1080p a capacidade de fazê-lo com inferência. O DLSS é certamente um dos recursos mais poderosos das GPUs RTX. Eles não são tão poderosos quanto esperávamos, e os efeitos de rastreamento de raios são bonitos, mas tendem a ter um tamanho considerável. impacto no desempenho, mas o DLSS nos oferece o melhor dos dois mundos: jogos com melhor aparência e melhor desempenho também.

Originalmente, parecia que o DLSS seria um recurso de nicho para placas gráficas de baixo custo, mas não é o caso. Em vez disso, o DLSS permitiu jogos como Cyberpunk 2077 Ao controle para aumentar a fidelidade visual em hardware de ponta sem tornar os jogos impossíveis de jogar. O DLSS eleva o hardware de baixo custo enquanto fornece uma visão do futuro para o hardware de alto nível.

A Nvidia mostrou os jogos de renderização RTX 3090 como Wolfenstein: YoungBlood em 8K com ray tracing e DLSS ativado. Embora a ampla adoção de 8K ainda esteja longe, os monitores 4K estão se tornando cada vez mais comuns. Em vez de renderizar em 4K nativo e esperar ficar em torno de 50 fps a 60 fps, os jogadores podem renderizar em 1080p ou 1440p e usar DLSS para preencher as informações que faltam. O resultado são taxas de quadros mais altas sem uma perda perceptível na qualidade da imagem.

O DLSS também está melhorando o tempo todo e recebe atualizações regulares na tentativa de melhorar o algoritmo de IA. Ele agora permite fazer uso mais inteligente de vetores de movimento, o que essencialmente ajuda a melhorar a aparência dos objetos quando estão em movimento. A atualização também reduz fantasmas, torna os efeitos de partículas mais nítidos e melhora a estabilidade temporal. O DLSS 2 agora é amplamente adotado e 216 jogos o suportam em setembro de 2022.

As melhorias não param por aí, no entanto. Na verdade, as coisas estão prestes a ficar muito mais interessantes com a introdução do DLSS 3.

DLSS 3 reinventa a tecnologia renderizando quadros em vez de pixels

Uma comparação entre a qualidade gráfica sem DLSS 3 e com ele.
nvidia

Em 20 de setembro, durante sua palestra principal do GTC 2022, a Nvidia anunciou o DLSS 3 — a mais recente iteração da tecnologia que estará disponível para os proprietários de placas gráficas da série RTX 40. Ao contrário de algumas das atualizações menores anteriores, as mudanças no DLSS são grandes desta vez e têm o potencial de oferecer um grande aumento no desempenho com a adição de quadros gerados por IA, que são criados usando os quadros reais que uma GPU processa. Isso é muito diferente do DLSS e do DLSS 2, que apenas retocaram quadros reais com upscaling alimentado por IA.

Atualmente, existem quatro GPUs compatíveis com DLSS 3:

  • RTX 4090
  • RTX 4080
  • RTX 4070Ti
  • RTX 4070

Em nossa análise do RTX 4090, descobrimos que o DLSS 3 foi capaz de fornecer taxas de quadros significativamente mais altas do que o DLSS 2. Em Cyberpunk 2077 em 4K com ray tracing definido no máximo, ativar o DLSS 3 rendeu quase 50% mais quadros do que apenas usar o DLSS 2; comparado a não usar DLSS, o DLSS 3 tinha mais de três vezes a taxa de quadros. Nesse aspecto, o DLSS 3 oferece exatamente o que a Nvidia prometeu.

Desempenho do DLSS 3 no Cyberpunk 2077 com o RTX 4090.

No entanto, existem algumas limitações técnicas com o DLSS 3. Basicamente, o DLSS insere um quadro gerado por AI entre dois quadros reais, e esse quadro AI é elaborado com base nas diferenças entre os dois quadros reais. Naturalmente, isso significa que a GPU não pode mostrar o segundo quadro real antes de você ver o quadro gerado pela IA, e é por isso que a latência é muito maior com o DLSS 3. Esta é a razão pela qual Nvidia Reflex também precisa ser ativado para que o DLSS 3 funcione.

A outra grande limitação do DLSS 3 é simplesmente os quadros gerados por IA com erros e bugs visuais estranhos. Em nossos testes, descobrimos que houve uma queda geral na qualidade ao habilitar o DLSS 3, o que é fácil de ignorar quando os ganhos da taxa de quadros são tão altos, mas alguns problemas de qualidade são difíceis de ignorar. Os elementos da interface do usuário ou do HUD, em particular, ficam distorcidos nos quadros gerados pela IA, presumivelmente porque a IA é voltada para ambientes 3D e não para texto 2D que está no topo do próprio jogo. O DLSS 2 não tem esse problema porque a interface do usuário é renderizada independentemente dos elementos 3D, ao contrário do DLSS 3.

Abaixo está uma captura de tela de Cyberpunk 2077 comparando DLSS 3, DLSS 2 e resolução nativa da esquerda para a direita. No que diz respeito ao ambiente, ambas as implementações de DLSS são melhores que a nativa, mas você pode veja também que na captura de tela do DLSS 3 à esquerda, o marcador de missão está distorcido e o texto está ilegível. Isso geralmente é o que acontece em quadros gerados por IA em jogos que possuem DLSS 3.

DLSS 3 em Cyberpunk 2077.

Por um lado, o DLSS 3 aumenta ainda mais os quadros e geralmente não tem uma qualidade visual muito pior do que o DLSS 2. Mas, por outro lado, habilitar o DLSS 3 faz com que a latência seja muito alta em relação à taxa de quadros e pode introduzir bugs visuais estranhos, especialmente em elementos de interface do usuário e HUD. Reduzir a latência e reduzir os artefatos visuais sem dúvida será um desafio para a Nvidia, pois essas são compensações fundamentais que acompanham o DLSS 3. Para uma tecnologia de primeira geração, no entanto, é uma boa primeira tentativa e, com sorte, a Nvidia será capaz de melhorar as coisas com futuras iterações do DLSS 3.

O DLSS 3 está lentamente entrando em mais jogos. Aqui estão os títulos que atualmente suportam DLSS 3:

  • Um Conto da Peste: Réquiem
  • coração atômico
  • Memória Brilhante: Infinita
  • Chernobilita
  • lâmina do conquistador
  • Cyberpunk 2077
  • Entregue-nos Marte
  • Destruir todos os humanos 2
  • luz moribunda 2
  • F1 22
  • FIST: Forjado em Shadow Torch
  • Assassino 3
  • Legado de Hogwarts
  • Icaro
  • Jurassic World Evolução 2
  • Justiça
  • Loopmancer
  • Marotos
  • Homem-Aranha da Marvel Remasterizado
  • Microsoft Flight Simulator
  • Caça ao Fantasma da Meia-Noite
  • Mount and Blade 2 Bannerlord
  • Naraka Bladepoint
  • Portal RTX
  • Arrancar
  • A Caçada Selvagem de Witcher 3
  • Warhammer 40.000 Darktide

DLSS versus FSR versus RSR versus XeSS

Os CEOs da Nvidia e da AMD lado a lado.

A AMD é a maior concorrente da Nvidia quando se trata de tecnologia gráfica. Para competir com DLSS, AMD lançou o FidelityFX Super Resolution (FSR) em 2021. Embora atinja o mesmo objetivo de melhorar os visuais enquanto aumenta as taxas de quadros, o FSR funciona de maneira bem diferente do DLSS. O FSR renderiza quadros em uma resolução mais baixa e, em seguida, usa um algoritmo de upscaling espacial de código aberto para faça o jogo parecer que está rodando em uma resolução mais alta e não leve em consideração o vetor de movimento dados. O DLSS usa um algoritmo AI para fornecer os mesmos resultados, mas essa técnica é suportada apenas pelas próprias GPUs RTX da Nvidia. O FSR, por outro lado, pode funcionar em praticamente qualquer GPU.

Super resolução AMD FidelityFX: desempenho superalimentado

Além do FSR, a AMD também possui Radeon Super Resolution (RSR), que é uma técnica de upscaling espacial que faz uso de IA. Embora isso pareça semelhante ao DLSS, existem diferenças. O RSR é construído usando o mesmo algoritmo que o FidelityFX Super Resolution (FSR) e é um recurso baseado em driver fornecido pelo software Adrenalin da AMD. O RSR visa preencher a lacuna onde o FSR não está disponível, pois o último deve ser implementado diretamente em jogos específicos. Essencialmente, o RSR deve funcionar em quase todos os jogos, pois não exige que os desenvolvedores o implementem. Notavelmente, o FSR está disponível nas GPUs Nvidia e AMD mais recentes, e o RSR, por outro lado, é compatível apenas com as placas RDNA da AMD, que incluem a Radeon RX 5000 e série RX 6000. Em breve, essa programação será expandida para incluir RDNA 3 e suas GPUs da série Radeon RX 7000.

A Intel também tem trabalhado em sua própria tecnologia de supersampling chamada Xe Super Sampling (XeSS), e ao contrário do FSR ou DLSS, existem duas versões diferentes disponíveis. A primeira faz uso das unidades matemáticas da matriz XMX, presentes em seu novo GPUs Arc Alchemist; essas unidades XMX cuidam de todo o processamento de IA no lado do hardware. A outra versão faz uso da instrução amplamente aceita de produto vetorial de quatro elementos (DP4a), removendo assim a dependência do próprio hardware da Intel e permitindo que o XeSS funcione na Nvidia e AMD GPU.

Recomendações dos editores

  • A Nvidia acabou de consertar os conectores de energia derretidos do RTX 4090?
  • RTX 4060 Ti 16GB é lançado em 18 de julho em meio a cortes de preços desesperados
  • O que é RAM? Aqui está tudo o que você precisa saber
  • O que é GDDR7? Tudo o que você precisa saber sobre a próxima geração de VRAM
  • Testei o novo RTX 4060 da Nvidia contra o RX 7600 - e não é bonito