NVIDIA DLSS 3.5原理淺析 大家好像都搞錯了!

2023-08-25 18:31:13    編輯: robot
導讀 在剛剛开幕的德國科隆遊戲展2023(Gamescom 2023)上公布了衆多遊戲宣傳片,還有實機畫面。不過我們今天說說NVIDIA同步更新的DLSS 3.5這項技術。 1  RTX 20系可开啓DL...

在剛剛开幕的德國科隆遊戲展2023(Gamescom 2023)上公布了衆多遊戲宣傳片,還有實機畫面。不過我們今天說說NVIDIA同步更新的DLSS 3.5這項技術。


1  RTX 20系可开啓DLSS 3.5 ?

由於大部分的宣傳中都提到,DLSS 3.5不僅支持RTX 40系顯卡,所有RTX顯卡都可以开啓。

所以玩家自動認爲RTX 20系也可以开啓它的上一個版本“DLSS 3.0”了,並不是。

本次DLSS 3.5並不是DLSS 3.0的直接版本迭代升級,而是在DLSS 3.0的基礎上增加了RR(Ray Reconstruction)功能。


簡單來說,RTX 4060可以享受到目前技術中的【SR+FG+RR】;RTX 2060可以享受到【SR+RR】,但因爲加入了RR的DLSS統稱爲3.5版本,所以才有以上的誤會。

2  光线追蹤是如何工作的

誤會解除,下面來看看DLSS 3.5的RR到底是什么。


首先在遊戲場景中,不管是汽車、房子、樹木之類的物體,都是具有實體的幾何圖形和材質,DLSS可以通過超分辨率根據模型來重建物體。但目前的遊戲中,光影效果正在扮演越來越重要的角色。而遊戲場景中的所有物體,在光线照射到自身時,都可以根據材質有不同反應,比如鏡子有直接的反射,粗糙的表面會有漫反射等等。

但光本身不具備實體,如果對屏幕上的每個像素發射光线對計算的要求過高,所以通常的做法是使用光线採樣。將光线以噪點的圖像輸出,來確定光追場景的具體展現方式。


最終反映到畫面中,降噪器有兩種不同的處理方法還原光追畫面。

1.多幀累計:當前幀和上一幀之中,保留好的像素,丟掉壞的像素,最終合成計算出光线效果

2.空間插值:查找當前幀中的相鄰像素並混合,最終形成一張通過插值採樣得來的效果

而不同類型的光追效果其實要用到多種降噪器處理,才能算出相對滿意的畫面,不但增加了开發成本和復雜程度,而且多個降噪器同時工作,也極大降低了光追遊戲中的幀數。


另外降噪器採用的多幀累計雖然增加了細節,但實際上是借取過去的光线,仍存在引入鬼影、消除動態效果並降低其他效果的風險。


圖像放大是光线追蹤照明管线的最後一個階段,也是以高幀率體驗、細節豐富的關鍵。但隨着降噪消除或降低效果質量,圖像放大器所使用的精細細節(稱爲高頻信息)被去除,這就造成了我們在遊戲時會看到很多鬼影、模糊、細節丟失的問題。

3  DLSS 3.5的“RR”是什么

DLSS 3.5引入的Ray Reconstruction(光线重建)則是專爲“光线”开發的一套AI模型,它將需要人工設計的降噪器,替換爲NVIDIA超算訓練的AI網絡(在採樣光线之間生成更高質量的像素),利用所有可用信息來解決上述問題,並爲所有RTX GPU提升光线追蹤圖像質量。


DLSS 3.5 訓練的數據量是DLSS 3的5倍,可識別不同的光线追蹤效果,從而使用時間和空間數據,做出更明智的決策,並保留高頻信息以實現更高質量的升級。



光线重建使用離线渲染圖像進行訓練,這需要比實時遊戲所需的更多的計算能力。相比傳統的降噪器,光线重建可以從訓練數據中識別光照模式,例如全局光照或環境光遮蔽的光照模式,並在玩遊戲時在遊戲中重新創建這些模式。其最終效果比需要人工設計的降噪器更出色。

在《傳送門》RTX版中,關閉DLSS的情況下,降噪器難以處理空間插值,無法混合足夠的像素,從而產生斑點效果。

此外,降噪器無法從之前的幀中累積足夠的優質像素,導致光线上出現沸騰效果。开啓DLSS 3.5後,它可以識別與反射相關的特定模式,並保持圖像穩定,同時混合相鄰像素以生成高質量的反射。

在《賽博朋克2077》的以下場景中,汽車周圍不准確的車頭燈照明是由於人工設計的降噪器引入了前一幀中不准確的光照效果造成的。DLSS 3.5 准確地生成光照,因此可以識別出車燈的光束,並看到光线在車前路邊反射。


《賽博朋克 2077》中的夜之城街道充滿了旋轉廣告牌和霓虹燈的反射。通過开啓 DLSS 3.5,整個城市的畫面質量和清晰度得到了大幅提升:

可以看到在开啓DLSS 3.5後,不僅幀數再一次小幅提高,並且能正確模擬出光线的傳導,並進一步影響周圍材質的顏色變化。

4  總結

最後總結一下,其實DLSS 3.5增加了一個專門針對光线追蹤而开發的——光线重建AI模型,它並不依靠RTX 40系顯卡中的硬件單元,所以在所有RTX顯卡中均可开啓。

而DLSS 3.0的幀生成,則是依賴第四代Tensor Cores中最新引入的光流加速器(New Optical Flow Accelerator),光流加速器在原本DLSS 2的基礎上,還可以計算兩個連續幀內的光流場,能夠捕捉遊戲畫面從第1幀到第2幀的方向和速度,從中捕捉粒子、反射和光照等像素信息。並分別計算運動矢量和光流來獲得精准的陰影重建效果。

所以,這也是爲何DLSS 3中的幀生成爲RTX 40系顯卡獨享。


雖然RTX 20/30系顯卡同樣能夠开啓DLSS 3.5中的RR,但它的作用更多是“錦上添花”的效果,幀數提升有限。況且,即便RTX 4060相比RTX 3060的提升只有20%左右,但別忘了RTX 40系顯卡尤其加強的Tensor算力和L2緩存,在處理光追和DLSS時,都有着得天獨厚的優勢。

我們常說NVIDIA近幾年發力點一直在AI計算上,遊戲卡似乎有些忽略。

但在RTX 40系顯卡中加強的AI性能,其實大部分用戶感知不大,而DLSS則相當於一個針對AI,長期優化的專屬軟件。我認爲無論是對於遊戲玩家還是內容創作者,都是值得投資的。



標題:NVIDIA DLSS 3.5原理淺析 大家好像都搞錯了!

地址:https://www.utechfun.com/post/253558.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡