Как работает Nvidia DLSS 3 и почему FSR пока не может догнать

относительно избранного изображения 2
Эта история является частью серии ReSpec Джейкоба Роуча, посвященной компьютерным играм и оборудованию.

Nvidia Видеокарты RTX 40-й серии прибудут через несколько коротких недель, но среди всех аппаратных улучшений есть то, что может быть золотым яйцом Nvidia: ДЛСС 3. Это гораздо больше, чем просто обновление популярной функции Nvidia DLSS (Deep Learning Super Sampling), и оно может закончиться определение следующего поколения Nvidia гораздо больше, чем сами видеокарты.

Содержание

  • Как работает DLSS 3 (и как не работает)
  • Где ИИ имеет значение
  • Почему FSR 2.0 не может догнать (пока)

Рекомендуемые видео

AMD прилагает все усилия, чтобы получить Суперразрешение FidelityFX (FSR) наравне с DLSS, и в течение последних нескольких месяцев это было успешно. Похоже, что DLSS 3 изменит эту динамику — и на этот раз FSR, возможно, не сможет наверстать упущенное в ближайшее время.

Как работает DLSS 3 (и как не работает)

Диаграмма, показывающая, как работает технология Nvidia DLSS 3.
Нвидиа

Вам простительно думать, что DLSS 3 — это совершенно новая версия DLSS, но это не так. Или, по крайней мере, это не совсем ново. В основе DLSS 3 лежит та же технология сверхвысокого разрешения, которая сегодня доступна в играх DLSS, и Nvidia, по-видимому, продолжит улучшать ее в новых версиях. Nvidia говорит, что теперь вы увидите часть сверхвысокого разрешения DLSS 3 в качестве отдельной опции в настройках графики.

Связанный

  • Nvidia не продает видеокарты — она продает DLSS
  • Версия Chrome для Nvidia DLSS готова к запуску, но вы пока не можете ее использовать
  • Вот почему заявления Nvidia против драйверов AMD просто не складываются

Новая часть — генерация кадров. DLSS 3 будет генерировать совершенно уникальный кадр каждый второй кадр, по сути генерируя семь из каждых восьми пикселей, которые вы видите. Вы можете увидеть иллюстрацию этого на блок-схеме ниже. В случае 4K ваш графический процессор отображает пиксели только для 1080p и использует эту информацию не только для текущего кадра, но и для следующего кадра.

Диаграмма, показывающая, как DLSS 3 реконструирует кадры.
Нвидиа

Генерация кадров, по словам Nvidia, будет отдельным переключателем сверхвысокого разрешения. Это связано с тем, что пока генерация кадров работает только на графических процессорах RTX 40-й серии, а суперразрешение продолжит работать на всех видеокартах RTX, даже в играх, обновленных до DLSS 3. Само собой разумеется, что если половина ваших кадров полностью сгенерирована, это повысит вашу производительность на много.

Однако генерация кадров — это не просто какой-то секретный соус ИИ. В DLSS 2 и такие инструменты, как FSR, векторы движения являются ключевыми входными данными для масштабирования. Они описывают, где объекты перемещаются из одного кадра в другой, но векторы движения применяются только к геометрии в сцене. Элементы, не имеющие трехмерной геометрии, такие как тени, отражения и частицы, традиционно маскировались в процессе масштабирования, чтобы избежать визуальных артефактов.

Движение диаграммы через Nvidia DLSS 3.
Нвидиа

Маскировка невозможна, когда ИИ генерирует совершенно уникальный кадр, и именно здесь в игру вступает ускоритель оптического потока в графических процессорах RTX 40-й серии. Это похоже на вектор движения, за исключением того, что видеокарта отслеживает движение отдельных пикселей от одного кадра к другому. Это поле оптического потока, наряду с векторами движения, глубиной и цветом, вносит свой вклад в кадр, сгенерированный ИИ.

Звучит как все плюсы, но есть большая проблема с кадрами, генерируемыми ИИ: они увеличивают задержку. Кадр, сгенерированный ИИ, никогда не проходит через ваш ПК — это «фальшивый» кадр, поэтому вы не увидите его на традиционных показаниях fps в играх или таких инструментах, как FRAPS. Таким образом, задержка не снижается, несмотря на наличие большого количества дополнительных кадров, а из-за вычислительных издержек оптического потока задержка фактически увеличивается. Из-за этого для DLSS 3 требуется Нвидиа Рефлекс чтобы компенсировать более высокую задержку.

Обычно ваш процессор сохраняет очередь рендеринга для вашей видеокарты, чтобы убедиться, что ваш графический процессор никогда не ждет выполнения работы (что может вызвать заикание и падение частоты кадров). Reflex удаляет очередь рендеринга и синхронизирует ваш GPU и CPU, так что, как только ваш CPU может отправлять инструкции, GPU начинает их обрабатывать. По словам Nvidia, при применении поверх DLSS 3 Reflex иногда может даже привести к уменьшению задержки.

Где ИИ имеет значение

Симулятор полета Майкрософт | NVIDIA DLSS 3 — эксклюзивный первый взгляд

AMD FSR 2.0 не использует ИИ, и, как я уже писал некоторое время назад, это доказывает, что вы можете получить то же качество, что и DLSS с алгоритмами вместо машинного обучения. DLSS 3 меняет это благодаря своим уникальным возможностям генерации кадров, а также внедрению оптического потока.

Оптический поток — не новая идея — он существует уже несколько десятилетий и находит применение во всем, от приложений для редактирования видео до беспилотных автомобилей. Однако, расчет оптического потока с помощью машинного обучения является относительно новым из-за увеличения количества наборов данных для обучения моделей ИИ. Причина, по которой вы хотите использовать ИИ, проста: он производит меньше визуальных ошибок при достаточном обучении и не требует больших накладных расходов во время выполнения.

DLSS выполняется во время выполнения. Можно разработать алгоритм, свободный от машинного обучения, для оценки того, как каждый пиксель перемещается из одного кадра в другой. следующий, но это требует больших вычислительных ресурсов, что противоречит всему смыслу суперсэмплинга в первом место. С моделью ИИ, которая не требует большой мощности и достаточного количества обучающих данных — и будьте уверены, Nvidia большое количество обучающих данных для работы — вы можете добиться высокого качества оптического потока, который можно выполнять в время выполнения.

Это приводит к улучшению частоты кадров даже в играх с ограниченным процессором. Суперсэмплинг применяется только к вашему разрешению, которое почти полностью зависит от вашего графического процессора. С новым кадром, который обходит обработку ЦП, DLSS 3 может удвоить частоту кадров в играх, даже если у вас есть полный Узкое место ЦП. Это впечатляет и в настоящее время возможно только с ИИ.

Почему FSR 2.0 не может догнать (пока)

Сравнение качества изображения FSR и DLSS в God of War.

AMD действительно сделала невозможное с FSR 2.0. Это выглядит фантастически, и тот факт, что он не зависит от бренда, еще лучше. Я был готов угробить DLSS для FSR 2.0 так как я впервые увидел его в Петля смерти. Но как бы мне ни нравился FSR 2.0, и я считаю, что это отличный продукт от AMD, в ближайшее время он не догонит DLSS 3.

Во-первых, разработать алгоритм, который может отслеживать каждый пиксель между кадрами без артефактов, достаточно сложно, особенно в 3D-среде с плотной мелкой детализацией (Киберпанк 2077 является ярким примером). Можно, но тяжело. Однако большая проблема заключается в том, насколько раздутым должен быть этот алгоритм. Отслеживание каждого пикселя в 3D-пространстве, расчет оптического потока, генерация кадра и исправление любых сбоев, которые случаются на этом пути, — многого не хватает.

Заставить его работать во время выполнения игры и по-прежнему обеспечивать улучшение частоты кадров на уровне FSR 2.0 или DLSS — это еще не все. Nvidia, даже с выделенными процессорами и обученной моделью, по-прежнему должна использовать Reflex, чтобы компенсировать более высокую задержку, вызванную оптическим потоком. Без этого аппаратного или программного обеспечения FSR, скорее всего, будет жертвовать слишком большой задержкой для генерации кадров.

Я не сомневаюсь, что AMD и другие разработчики в конце концов добьются этого или найдут другой способ решения проблемы, но это может произойти через несколько лет. Трудно сказать прямо сейчас.

Скоро — GeForce RTX 4090 DLSS 3, первый тизер-трейлер

Что легко сказать, так это то, что DLSS 3 выглядит очень интересно. Конечно, нам придется подождать, пока он не появится, чтобы подтвердить заявления Nvidia о производительности и посмотреть, как держится качество изображения. Пока что у нас есть только короткое видео от Digital Foundry, демонстрирующее кадры DLSS 3 (выше), которое я настоятельно рекомендую посмотреть, пока мы не увидим дальнейшее стороннее тестирование. Однако с нашей нынешней точки зрения DLSS 3, безусловно, выглядит многообещающе.

Эта статья является частью ReSpec — постоянная двухнедельная колонка, включающая обсуждения, советы и подробные отчеты о технологиях, лежащих в основе компьютерных игр.

Рекомендации редакции

  • Почему Nvidia RTX 4060 Ti просто недостаточно для 2023 года
  • Вот как можно бесплатно получить Redfall Bite Back Edition от Nvidia.
  • Я перешел на GPU AMD на месяц — вот почему я не скучаю по Nvidia
  • Если заявления AMD о RX 7900 XTX верны, у Nvidia могут быть большие проблемы
  • AMD разрывает плавящийся адаптер RTX 4090, поскольку Nvidia сталкивается с коллективным иском