耕升RTX 4070 SUPER 踏雪 黑神話定制版顯卡評測 不負衆望天命所歸

2024-09-25 18:32:22    編輯: robot
導讀 如果問哪款遊戲是今年玩家心中的NO.1,那么當屬遊科的《黑神話:悟空》,爲此衆多顯卡廠商也推出了黑神話聯名款顯卡,今天給大家帶來的則是耕升GeForce RTX 4070 SUPER 踏雪 OC 定...

如果問哪款遊戲是今年玩家心中的NO.1,那么當屬遊科的《黑神話:悟空》,爲此衆多顯卡廠商也推出了黑神話聯名款顯卡,今天給大家帶來的則是耕升GeForce RTX 4070 SUPER 踏雪 OC 定制版顯卡的評測。

截止目前,《黑神話:悟空》在Steam平台的銷量已經達到了1900萬份,全網銷量保守預估已超2000萬分。作爲國產第一款走向世界,極限跨圈的3A遊戲,着實令人興奮。並且由於遊戲內很多物品和景色均採用實地取景,甚至吸引了不少鑑寶博主的遊玩和點評。

關於黑神話的成功不必多說,而首批持觀望態度的玩家,現在也正打算升級自己的配置,來體驗真正影視級的畫面,下面就讓我們來一起看下耕升GeForce RTX 4070 SUPER 踏雪 OC 定制版顯卡。

1 耕升GeForce RTX 4070 SUPER 踏雪OC 定制版顯卡 概覽

耕升GeForce RTX 4070 SUPER 踏雪OC 定制版顯卡在外包裝上採用了黑神話天命人主題,即便是踏雪系列標志性的純白色調,這次也改爲了黑色。

下面來看顯卡本體,耕升GeForce RTX 4070 SUPER 踏雪OC 定制版顯卡的正面已就位純白色調,仍然保持了踏雪系列的風格。整體尺寸約爲315×122×40mm(不含擋板),佔用2槽空間,作爲一款中高端產品來說,它的厚度控制的比較出色。

散熱方面,耕升GeForce RTX 4070 SUPER 踏雪OC 定制版顯卡整體採用了“風雪”散熱模組。主動散熱的風扇部分,採用優化後的3個92mm炫風之刃風扇,經改良後提升風流量,並減低聲噪,有效加強散熱,纖巧的體積更可大大減低對機箱空間的要求。而在扇葉外側,還新增了特殊構造風扇罩,大幅提高氣流穩定性並能降低噪音。而風扇中央的扇標設計,則是熟悉的“雪花標”。

內部散熱上,耕升GeForce RTX 4070 SUPER 踏雪OC 定制版顯卡採用大面積緊密散熱鰭片,高效銅板搭配4跟6mm復合式熱導管,並且熱導管加入了鍍鎳設計,進一步加強抗氧化能力。

耕升GeForce RTX 4070 SUPER 踏雪OC 定制版顯卡的背板採用了定制外觀,以天命人爲主要視覺,神態表情刻畫頗爲細膩,也彰顯了遊戲內角色和遊戲外玩家,重走西遊的決心。

散熱方面,背板採用了穿透式散熱系統設計,右方進一步加大積鏤空間,配合散熱器上第三組風扇的風流直接穿透散熱鰭片以及鏤空的PCB設計,令顯卡溫度進一步下降。

視頻輸出接口上,依舊採用了HDMI 2.1 + DP 1.4a*3的四接口設計。HDMI 2.1可支持4K 120Hz HDR、8K 60Hz HDR。從側面可以看出耕升GeForce RTX 4070 SUPER 踏雪OC 定制版顯卡相當輕薄。

耕升GeForce RTX 4070 SUPER 踏雪OC 定制版顯卡側面可以看到16pin供電接口,它的TDP功耗爲220W,建議電源600W及以上。

2 NVIDIA GeForce RTX 4070 SUPER 架構淺析

本次發布的GeForce RTX 40系顯卡由全新的NVIDIA Ada Lovelace架構打造,採用TSMC 4N NVIDIA定制工藝,旗艦核心AD102達到了的760億個晶體管,而在RTX 30系顯卡中爲280億個。


與上一代NVIDIA Ampere相比,NVIDIA Ada Lovelace在相同功率下,具有2倍以上的性能提升,最高可達到90-TFLOPS的着色器數據吞吐量。

本次發布的RTX 4070 SUPER共有7168個CUDA核心,提供了35.5-TFLOPS算力;56個第三代Ada RT Core擁有82.1 RT-TFLOPS;224個第四代Tensor Core可提供568 Tensor-TFLOPS(AI TOPS)

RTX 4070 SUPER的L2 Cache容量爲48MB,帶寬爲504 GB/s。NVIDIA官方也特別表明了L2 Cache的重要性,我們以兩張圖來簡單說明L2緩存的作用。


在真正的GPU中,內核是所有計算發生的地方,而這就是L1數據緩存的作用所在。每個SM都有一個超低延遲的L1數據緩存,緊挨其處理內核,使L1成爲GPU尋找信息的首選。然而由於L1緩存需要離內核非常近,不可能非常大。


如果在L1緩存中找不到內核計算所需的數據,GPU將在L2數據緩存中尋找。這個顯存系統位於GPU芯片上,並通過一個非常高速的橫梁系統連接到所有的GPC(圖形處理集群),每個GPC包括多個SM。如果在L2緩存中找到了信息,那么GPU就挑出這些數據並將其放入內核。

如果在L2緩存中找不到信息(被稱爲緩存缺失),那么GPU將通過顯存接口在VRAM中尋找。這在整個GPU存儲子系統中產生了很多額外的工作量,並降低了性能和功耗效率。


更多詳細的參數,我們爲大家總結出了一張表格,可以看到從各方面的規格來說,這張RTX 4070 SUPER更接近於RTX 4070 Ti,但功耗相比RTX 4070只提升了20W。

3 測試平台簡介

首先介紹一下測試平台,爲了保障耕升GeForce RTX 4070 SUPER 踏雪OC 定制版顯卡的性能發揮,我們的平台採用了上代旗艦i9-13900K。

下面還是來看看本次評測的顯卡參數,目前最新的GPU-Z爲2.60版本,參數識別較爲詳細。

耕升GeForce RTX 4070 SUPER 踏雪OC 定制版顯卡擁有7168個CUDA,Boost頻率爲2550MHz,較公版的2475MHz提升較大。

顯存方面,12GB GDDR6X顯存,位寬爲192bit,顯存帶寬504 GB/s,光柵單元和紋理單元爲80和224。

4  《黑神話:悟空》遊戲測試

既然是黑神話悟空的定制版顯卡,那么就先來測試一下這款由虛幻5引擎制作的遊戲。另外《黑神話:悟空》支持DLSS以及FSR,並且均可开啓幀生成,但是DLSS可以搭配全景光线追蹤提供更逼真絲滑的遊戲體驗,所以我們本次DLSS測試,均在开啓幀生成下記錄幀數。

測試分別在2K及4K分辨率下進行,雖然RTX 4070 SUPER這張顯卡定位2K高幀率的3A遊戲,不過可以看到,在DLSS超級性能模式下,這張耕升GeForce RTX 4070 SUPER 踏雪OC 定制版顯卡也有着82幀的流暢水准。不過想要在打鬥中享受電競級幀率體驗,還是建議在2K分辨率下。

另外目前《黑神話:悟空》在設置上還有幾點需要注意,就是超採樣清晰度和分辨率。



《黑神話:悟空》沒有提供直接的檔位,而是滑塊拖數字來改變檔位。經過我們實測,在同一檔位中,DLSS的縮放比例是相同的,所以得到的幀數也完全相同。大家只看“質量”或“性能”檔位即可。



還有就是分辨率調節,《黑神話:悟空》目前沒有全屏獨佔,只有窗口化全屏,所以在遊戲內設置低分辨率,而桌面仍然用高分辨率的話,幀數提升並不明顯。

經過實測,我們發現兩端同步調節分辨率,相比只降低遊戲分辨率,幀數差距非常大。

雖然大部分遊戲大家都沒有將分辨率玩的情況,但《黑神話:悟空》採用的虛幻5引擎,非常耗費配置,如果玩家想通過降低分辨率來獲得流暢的幀數,還需特別注意。

光线追蹤對比

《黑神話:悟空》在模型上,採用了虛幻5引擎的Nanite虛擬微多邊形幾何體系統,它消除了LOD的繁瑣任務,可以掃描並導入極高精細程度的模型。並且,這不會影響性能,仍然可以獲得實時幀速率。因此,在遊戲中我們可以看到大量高精度模型,而其中很多都是直接掃描自實地。

下面直接看效果對比。


在开啓光追後,上圖充分展示了“多重反射光线追蹤間接照明”,自然色彩的光线能夠在整個世界中反彈兩次,創造更真實的間接照明和遮蔽效果。在河邊的樹林中,關閉光追的情況下,場景非常暗,而經過間接照明,能提供更准確的場景和物體光照,符合自然規律,使每個場景的沉浸感拉滿。


《黑神話:悟空》最能體現光追效果的地方還是在水中,除了之前大家比較熟悉的光线追蹤反射,這次遊戲中還加入了“光线追蹤焦散”。


當足量的光线從特定表面的反彈出來時,照亮一些物體的表面區域,使其亮度高於場景中的均值。上圖最能說明這一點,其中水面上的漣漪顯示在水下附近物體的表面上。這樣一來,遊戲中的水體再也不會像以前一樣,如同鏡子般光亮, 而是有了更真實的水體效果。

DLSS 效果對比

本次《黑神話:悟空》中,超分辨率採樣也是大家關注的焦點之一,畢竟以目前顯卡的性能來說,即便是RTX 4090,要想在4K分辨率下开啓光线追蹤跑原生影視級畫質,也是無法流暢運行的。

上面我們提到過《黑神話:悟空》採用了Nanite虛擬微多邊形幾何體系統,可以導入極高精細程度的模型。所以DLSS在“猜想”上,也有了更多憑據。


而《黑神話:悟空》也是目前我見過遊戲中,DLSS效果最好的。可以看到,由於有復雜模型作爲支撐,即便是在超級性能模式中,場景中所有的景物,包括主角的衣服,都和原生畫質幾乎毫無區別,但幀數相比原生畫質,足足提升了200%還多。所以如果你感覺幀數不夠,大可以將超採樣清晰度降低一些,來獲得穩定的高幀率。

全局光照 效果對比

除了光线追蹤和DLSS,《黑神話:悟空》還有一個畫質選項有較多爭議,就是全局光照。有的玩家說要开到最高,有的說最低才更真實。

下面我們就來實際對比一下,從圖中能明顯看到,在全局光照低的畫面中,亮的地方更亮,暗的地方又難以視物。而在全局光照超級中,畫面整體更加平衡,即使暗的地方,也保有更多細節。


所以經過幾組對比,大家很明顯能發現“全局光照”這個概念,重點就在全局二字。

舉個簡單的例子,在完全漆黑的房間中,有一束手電光。在沒有全局光照的情況下,我們只能看到這一束光所照的範圍。而有全局光照的加持,我們能借助這一束手電光的反射來看到整個房間的全貌。


並且經過實測,全局光照檔位的高低,對幀數完全沒有影響,所以大家在設定畫面時,建議把全局光照开到最高。

5 理論性能測試

本次耕升GeForce RTX 4070 SUPER 踏雪OC 定制版顯卡主要對比它的上下型號,RTX 4070 Ti以及RTX 4070。

下面先進行的是用來衡量顯卡DX11理論性能的3DMARKFS套裝:FS,FSE,FSU三者分別對應顯卡在1080P、2K、4K的理論性能,取顯卡分數實際測試結果如下:

在FS測試中,耕升GeForce RTX 4070 SUPER 踏雪OC 定制版顯卡相比RTX 4070,其中FS提升16%;FSE提升16%;FUS提升21%,綜合提升18%。對比RTX 4070 Ti,綜合成績相差3%左右。

而在針對DX12環境下的Time Spy和Time Spy Extreme測試中,耕升GeForce RTX 4070 SUPER 踏雪OC 定制版顯卡相較RTX 4070的提升分別爲:TS提升14%;TSE提升14%,綜合約爲14%。對比RTX 4070 Ti,綜合成績相差8%左右。

PortRoyal是3DMARK中專門針對光追性能的測試項,耕升GeForce RTX 4070 SUPER 踏雪OC 定制版顯卡相較RTX 4070的提升約爲14%。對比RTX 4070 Ti,相差8%左右。

下面我們再來看看3DMARK中新增的一些具體應用場景的測試。

Speed Way這項測試結合了實時光线追蹤和傳統渲染技術來測量顯卡性能。場景含有光线追蹤反射、實時全局光照、網格着色器、體積照明、粒子和後處理效果。所以SW的測試基本可以看做次世代3A遊戲基准。

耕升GeForce RTX 4070 SUPER 踏雪OC 定制版顯卡對比RTX 4070,提升爲16%

在DLSS 3的理論測試中,耕升GeForce RTX 4070 SUPER 踏雪OC 定制版顯卡在2K分辨率下DLSS开關相比RTX 4070的提升爲16%/22%;4K分辨率,提升約爲15%/22%

從整體的理論測試成績來看,傳統的FS/TS/PR三項測試,耕升GeForce RTX 4070 SUPER 踏雪OC 定制版顯卡相比RTX 4070綜合提升約爲16%左右;相比RTX 4070 Ti的差距在6%左右。

6 常規遊戲 性能測試

由於本次RTX 40系加入了DLSS 3新技術,所以後面會進行單獨測試,這裏依然選擇主流的幾款3A大作進行遊戲性能對比。

在《極限競速:地平线5》中,其中耕升GeForce RTX 4070 SUPER 踏雪OC 定制版顯卡相比RTX 4070提升明顯,1080p達到12%,2K分辨率提升14%;4K分辨率提升17%,綜合提升14%

在《刺客信條:幻景》中,耕升GeForce RTX 4070 SUPER 踏雪OC 定制版顯卡相比RTX 4070的提升分別爲:1080p提升8%;2K提升10%;4K提升15%,綜合提升11%

在《無主之地3》中,耕升GeForce RTX 4070 SUPER 踏雪OC 定制版顯卡相比RTX 4070的提升分別爲:1080p提升21%;2K提升17%;4K分辨率提升16%,綜合提升18%

《光明記憶:無限》的光追測試軟件是獨立於遊戲的測試工具,比遊戲中用到的光线追蹤技術更多,測試條件爲“RTX最高/DLSS質量”。

性能方面,耕升GeForce RTX 4070 SUPER 踏雪OC 定制版顯卡相比RTX 4070的提升分別爲:1080p提升20%;2K提升24%;4K提升29%,綜合提升24%

在“遊戲測試標杆”的《賽博朋克2077》中,耕升GeForce RTX 4070 SUPER 踏雪OC 定制版顯卡在超級畫質下,2K分辨率百幀完全沒有問題的;在光追超級畫質下2K流暢運行同樣沒有問題;而作爲次世代光追體驗的超速模式中,2K分辨率下只有52幀。

不過上面我們的測試均爲DLSS 2模式,尚未开啓DLSS 3,下面在DLSS 3的專項測試中,能夠看到幀數上的飛躍。




從上至下依次爲超級畫質/光追超級/光线追蹤:超速模式。可以看到光线追蹤:超速模式相比光追超級更貼近於真實效果。它模擬了真實的光线路徑,其實相比之前的光线追蹤模擬了更多光线在不同表面的反射,完整的計算出了場景的真實光照,避免了上一代光追中出現“死黑”的情況。


另外《賽博朋克2077》更新了DLSS 3.5,支持光线重建技術。在上面的測試圖中不難發現,光线重建能夠更加精准的計算出反射部分的效果,接近於亮面金屬表面的反射中,未开啓RTX能夠看出畫質明顯的區別,不再贅述。重點在於DLSS 3.5的开關效果,除了廣告牌上所顯示的內容更清晰外,放大後能夠看到遠處電线以及工業區建築的細節外觀。

7 DLSS 3性能測試

隨着NVIDIA DLSS、NVIDIA Reflex以及先進的光线追蹤技術的普及速度不斷加快,現在已有超過600款RTX遊戲和應用,爲配備 GeForce RTX 40 系列顯卡的遊戲玩家帶來前所未有的性能和更高的圖像質量。


在DLSS 3的測試中,首先來看《賽博朋克2077》的我們同樣會將DLSS 3與DLSS 2的結果進行比對。

本次我們分別對《賽博朋克2077》,在三檔畫質下進行了DLSS 3的幀數測試,所有檔位均开啓DLSS質量記錄幀數。

可以看到在2K分辨率下,在是光追超速模式,开啓DLSS 3後耕升GeForce RTX 4070 SUPER 踏雪OC 定制版顯卡能達到81幀的成績,已經是流暢運行標准。

另外DLSS 3技術主要針對於CPU瓶頸的遊戲,所以也能夠看到在越低的分辨率,幀數提升越大,其中光追超速的1080p分辨率能夠達到51%左右的提升。

《星空》仍在持續更新,在加入了DLSS 3後,整體來看效果非常好,即便在4K分辨率下也能夠達到87幀的流暢水准。

其中1080p分辨率下DLSS 3相比DLSS 2提升達到62%;2K分辨率提升50%;4K分辨率提升43%。

《地平线5》也是顯卡測試的老朋友了,其出色的優化讓很多入門級產品都能跑出較高的幀率。在耕升GeForce RTX 4070 SUPER 踏雪OC 定制版顯卡也有較明顯的體現。在3種分辨率中,开啓DLSS 3相比DLSS 2的提升分別爲40%/29%/12%

8  生產力工具測試

V-Ray



在生產力工具上,我們測試了最新版本的V-Ray渲染器,選擇使用GPU渲染的CUDA測試和RTX測試,成績如圖。

Blender


Blender是一款專業的三維渲染軟件,目前推出了固定的benchmark跑分軟件,省去了安裝軟件下載素材的麻煩。軟件會自動渲染測試monster/junkshop/classroom共三個場景。

耕升GeForce RTX 4070 SUPER 踏雪OC 定制版顯卡得分分別爲3074/1498/1590分,平均2054分。

9 AIGC測試-Procyon

AI時代不知何時已經離人們的生活越來越近,小到文本改寫,大到各種生成式AI。此前我們已經測試過Stable Diffusion的AI繪圖能力,不過目前NVIDIA推出了全新的TensorRT插件,可以充分調用Tensor算力,下面我們來測試一下耕升GeForce RTX 4070 SUPER 踏雪 黑神話悟空聯名款顯卡在這方面的性能表現。

我們的測試使用UL Procyon進行,在最新的測試項目中,SD1.5可分爲INT8(8位整數)和FP16(半精度浮點)運算。

可明顯看到,採用INT8的運算時間更快,不過這並不意味着INT8在性能上更具優勢。

這裏簡單說明一下,INT8是使用更低精度的整數表示數據的一種方式,用於進一步減小模型的存儲空間和加快計算速度。使用INT8可以在一定程度上降低模型的計算復雜度,特別適用於部署在資源有限的設備上,如移動設備、嵌入式設備等。

FP16則是一種佔用存儲空間較小的浮點數表示方法,用於在深度學習模型中減少模型參數和中間結果的存儲需求,從而節省內存空間並提高計算效率。

不過在測試中並沒有包含FP32的單精度浮點運算,其實在深度學習模型中,完整的邏輯應當包含在內,下面也簡單進行介紹。

FP32是常見的浮點數表示方式,提供了更高的數值精度,適用於大多數深度學習模型的訓練和推理過程。FP32 的精度比FP16高,但會佔用更多的存儲空間和計算資源。

所以從運算精度上來說:FP32 > FP16 > INT8;而從內存佔用上來說是:INT8 < FP16 < FP32。它們之間的精度和內存佔用爲正比的關系。

上圖測試結果爲模型更復雜的SDXL,可以看到測試總時間爲261.141s。

另外,UL Procyon的AIGC測試同樣使用了StableDiffusion進行批量生成,相較我們手動生成圖片,結論更爲精准。

10  RTX 視頻超分辨率(RTX Video Super Resolution)測試

目前RTX 視頻超分辨率(RTX Video Super Resolution)已經在部分瀏覽器中進行測試,首先玩家需要更新到NVIDIA最新驅動,在NVIDIA控制面板中的【調整視頻圖像設置】可以看到最新的RTX 視頻增強超分辨率。

RTX 視頻超分辨率是 AI 圖像處理的突破,它超越了傳統的邊緣檢測和特徵銳化技術,極大地提升直播視頻內容的質量。

开啓RTX 視頻超分辨率不僅需要最新版驅動,還需要使用RTX 40或30系列GPU,並且幾乎適用於Google Chrome和Microsoft Edge瀏覽器中的所有視頻內容(瀏覽器也需要更新到最新版本)。

开啓後,目前已知的打开YouTube或者B站,都可以享受到RTX VSR效果的加成。

如果不確定,在全屏播放視頻時,可以打开任務管理器,看到GPU負載增加,即爲开啓成功。


 

(點擊放大查看原圖)

在下面這幅圖的對比中,可以明顯看到开啓RTX 視頻超分辨率後,胡須明顯更順滑,已經看不出馬賽克。

不過需要注意的是,RTX 視頻超分辨率在低分辨率下效果會更明顯,如果本身觀看的視頻爲1080p或2K以上,則基本很難看出區別。

這對於一些網速不夠快,只能看低分辨率視頻的用戶,或者視頻片源本身不夠清晰的情況,幫助非常大。

11 溫度及功耗測試

功耗測試中,我們選擇FurMark軟件進行拷機測試,並採用GPU-Z檢測溫度,功耗僅計算顯卡自身。

在最新的Furmark中,已經集成了相當多的功能,甚至還有benchmark跑分,不再是單純的拷機軟件。

耕升GeForce RTX 4070 SUPER 踏雪OC 定制版顯卡通過1小時左右的拷機測試,溫度在66℃左右,熱點溫度在78℃左右。

12 不負衆望 天命所歸

RTX 40 SUPER系列顯卡在整體定位相信大家早已了解,而RTX 4070 SUPER這個型號個人認爲是目前3A遊戲玩家首選。

綜合來看,RTX 4070 SUPER相比RTX 4070提升在15-20%左右,與RTX 4070 Ti的差距在5%左右,提升是巨大的,基本已經追到了RTX 4070 Ti的級別。

雖然RTX 4070 SUPER它定位2K分辨率的高幀光追遊戲,但不管是日常網遊、獨立遊戲,或是傳統3A遊戲,在4K分辨率下都能夠達到流暢甚至電競級水准。

本次耕升GeForce RTX 4070 SUPER 踏雪OC 定制版顯卡其實收藏意義更大,作爲國產第一款採用虛幻5引擎的3A遊戲,不僅走向世界,更創造了多項紀錄,甚至傳奇遊戲制作人小島秀夫,都在《黑神話:悟空》銷量破1000萬分的時候轉發了圖片,表示肯定。

這對於中國遊戲玩家和中國單機遊戲行業來說,必定是載入史冊的一年。相信時隔多年後,當你關閉電源後,看到機箱中靜靜“躺着”的天命人,依然能記得當初的那份感動。

而經過《黑神話:悟空》這道“大餐”,目前越來越多優秀的國產3A遊戲正在湧現出來,也讓玩家充滿期待。

目前耕升GeForce RTX 4070 SUPER 踏雪OC 定制版顯卡在各大電商中均有售賣,感興趣玩家不妨前去了解一下。



標題:耕升RTX 4070 SUPER 踏雪 黑神話定制版顯卡評測 不負衆望天命所歸

地址:https://www.utechfun.com/post/425097.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡