RTX40 SUPER系列新品共有三款,分別爲RTX 4070 SUPER、RTX 4070 Ti SUPER以及RTX 4080 SUPER,RTX 4080 SUPER是唯一一款加量減價的型號。規格相比RTX 4080更強,但起售價更低。如果從這個角度出發的話,那么RTX 4080 SUPER可以說是三款中最良心的型號。今天給大家帶來的是,來自華碩的TUF GeForce RTX 4080 SUPER O16G GAMING(後簡稱TUF RTX 4080 SUPER OC)顯卡的評測。
一、外觀設計
TUF RTX 4080 SUPER OC的包裝盒與自家RTX 4080保持一致,四個角均“切”了一刀,八邊形的設計在一衆新卡中還是很有特點的。
來到顯卡本體,TUF RTX 4080 SUPER OC採用的是啞黑配色,表面有磨砂處理。整體並不是特別高調,很有質感。導流罩與上一代保持一致,线條凌厲,棱角分明。
TUF RTX 4080 SUPER OC爲三風扇設計,均爲軸流風扇。左右扇葉朝向和轉向與中間不同。左右風扇爲逆時針旋轉,中間風扇則爲順時針旋轉。如此設計的原因是,可以減少亂流,提升散熱器風量。左右風扇中央爲TUF的Logo,中央風扇爲華碩的Logo。三把風扇均爲7扇葉,支持智能停轉。
TUF RTX 4080 SUPER OC的背面採用一塊鋁制背板,最外側對應風扇位置爲鏤空設計,提升散熱能力。對應核心、靠近頂部位置還有性能模式和安靜模式切換撥杆。這張顯卡需佔用3.65槽,從頂部可以看到非常厚的散熱鰭片,內部則有8根熱管貫穿其中,散熱規格妥妥高端水平。中央位置有12VHPWR供電接口,一側有可發光TUF的Logo,旁邊還有一條可發光的燈帶,兩者均支持ARGB。
接口方面,TUF RTX 4080 SUPER OC提供了3個DP1.4a和2個HDMI2.1a,最大支持分辨率爲7680x4320。
總體來看,TUF RTX 4080 SUPER OC的外觀設計頗有一種西裝暴徒的感覺,屬於人狠話不多的角色。
二、NVIDIA GeForce RTX 4080 SUPER架構淺析
此次新發布的三款GeForce RTX 40 SUPER顯卡依舊採用NVIDIA Ada Lovelace架構,TSMC4N英偉達定制工藝。與上一代NVIDIA Ampere相比,NVIDIA Ada Lovelace在相同功率下,具有2倍以上的性能提升,最高可達到90-TFLOPS的着色器數據吞吐量。
RTX 4080 SUPER的核心代號爲AD103-400-A1,共有10240個CUDA核心,提供了52-TFLOPS算力;80個第三代Ada RT Core擁有121RT-TFLOPS;320個第四代Tensor Core可提供836Tensor-TFLOPS(AITOPS)。
RTX 4080 SUPER的L2 Cache容量爲64MB,帶寬爲736GB/s。NVIDIA官方也強調了L2 Cache的重要性,我們以兩張圖來簡單說明L2緩存的作用。
GPU獲取數據的路徑,依次是L1緩存、L2緩存、顯存和系統內存。L1緩存緊鄰處理內核,延遲非常低。GPU尋找數據的首選就是L1緩存。如果目標數據不在L1緩存,GPU會在L2緩存中尋找。相比較L1緩存,L2緩存的延遲雖然無法做到L1緩存那么低,但容量可以做大。如果數據也不在L2緩存中,那么GPU會從顯存中尋找。再找不到就會從系統內存中獲取。
其實可以看到,GPU越早獲取到數據,性能和效率就會越高。由於核心和L1緩存兩者位置太近,所以L1緩存的容量不可能很大。所以,更大的L2緩存,將有效提高數據命中率,從而提高整體運行效率。RTX 4080 SUPER擁有更大的L2緩存容量,所以命中數據的概率更高。
更多詳細的參數,我們爲大家總結出了一張表格,可以看到,RTX 4080 SUPER的規格相比RTX 4080,CUDA增加了512個,RT Core、Tensor Core和紋理單元也有所增加,提升幅度約5.2%,另外頻率和顯存帶寬稍有提升。不過建議零售價卻直接便宜了1400元,非常良心,可謂加量大減價。
下面我們看一下具體的測試成績。
三、測試平台簡介
首先看一下測試平台。
爲了保證TUF RTX 4080 SUPER OC的性能表現,處理器選擇的是英特爾14代酷睿i7-14700K,並在主板BIOS中關閉能效核。主板是來自華碩的ROG MAXIMUS Z790 DAKR HERO;內存爲兩條16GB DDR5 7200內存,組成32GB容量;電源爲華碩ROG雷神2代1600W鈦金。運行系統爲Windows 11 23H2。
通過GPU-Z(2.57.0)可以看到TUF RTX 4080 SUPER OC的規格。其擁有10240個CUDA核心,基礎頻率爲2295MHz,Boost頻率爲2610MHz。光柵和紋理單元分別爲112個和320個。採用16GB GDDR6X顯存,顯存位寬256bit,帶寬736.3GB/s。驅動版本爲551.22。
四、理論性能測試
本次測試TUF RTX 4080 SUPER OC,主要對比RTX 4080和RTX 3080 Ti兩款顯卡。由於部分測試項較新,可能會缺失對比顯卡數據。
下面先進行的是用來衡量顯卡DX11理論性能的3DMARK FS套裝:FS、FSE和FSU三者分別對應顯卡在1080P、2K和4K的理論性能,取顯卡分數實際測試結果如下:
在FS測試中,TUF RTX 4080 SUPER OC相比RTX 4080,其中FS提升3%;FSE提升3.7%;FUS提升3.2%,綜合提升3.3%,提升幅度略小於核心規模差距。對比RTX 3080 Ti,綜合成績提升48%左右。
而在針對DX12環境下的Time Spy和Time Spy Extreme測試中,TUF RTX 4080 SUPER OC相較RTX 4080的提升分別爲:TS提升1.7%;TSE提升2%,綜合約爲1.85%,提升幅度同樣略低於核心規模差距。對比RTX 3080 Ti,綜合成績提升49%左右。
Port Royal是3DMARK中專門針對光追性能的測試項,TUF RTX 4080 SUPER OC相較RTX 4080的提升約爲2.7%。對比RTX 3080 Ti,提升45%左右。
下面我們再來看看3DMARK中新增的一些具體應用場景的測試。
Speed Way這項測試結合了實時光线追蹤和傳統渲染技術來測量顯卡性能。場景含有光线追蹤反射、實時全局光照、網格着色器、體積照明、粒子和後處理效果。所以SW的測試基本可以看做次世代3A遊戲基准。
TUF RTX 4080 SUPER OC對比RTX 4080,從2K和4K分辨率提升依次爲:3.4%和4.4%,與實際的核心規模差距比較接近。
另外我們使用3DMARK剛剛更新的DLSS3進行了相關性能測試。TUF RTX 4080 SUPER OC相比RTX 4080的提升爲:开啓下提升2%,關閉下提升4.6%。
從整體的理論測試成績來看,TUF RTX 4080 SUPER OC相比RTX4080的綜合提升幅度並不大,DX11下提升超過3%,DX12下接近2%。而最新的SW綜合測試的提升幅度在4%左右。看得出來,RTX 4080 SUPER在規模上與RTX 4080相差不大,再加上兩者在架構方面保持一致,最終導致兩者的理論性能差距是比較小的。
五、常規遊戲性能測試
由於本次RTX40系加入了DLSS3新技術,所以後面會進行單獨測試,這裏依然選擇主流的幾款3A大作進行遊戲性能對比。
在《極限競速:地平线5》中,其中TUF RTX 4080 SUPER OC相比RTX 4080,在2K分辨率提升3.8%;4K分辨率提升2.5%,綜合提升3.1%。相比RTX 3080 Ti提升幅度較大,綜合提升超過66%。
在《無主之地3》中,TUF RTX 4080 SUPER OC相比RTX 4080的提升分別爲:2K提升6%;4K分辨率提升4.5%,綜合提升超過5%。相比RTX 3080 Ti綜合提升38%。
《光明記憶:無限》光追測試軟件是獨立於遊戲的測試工具,實測TUF RTX 4080 SUPER OC相比RTX 4080的提升分別爲:2K提升5.5%;4K提升1.8%,綜合提升3.6%。相比RTX 3080 Ti綜合提升46%。
另外一款國產遊戲《邊境》的跑分軟件中,TUF RTX 4080 SUPER OC相比RTX 4080的提升分別爲:2K提升4.9%;4K提升5%,綜合提升5%。相比RTX 3080 Ti綜合提升56%。
在《賽博朋克2077》中,TUF RTX 4080 SUPER OC在超級畫質下,4K分辨率下的幀率超過80幀,流暢運行完全沒有問題;即使在光追超級畫質下,4K分辨率下的幀率甚至也能超過70幀,遊戲體驗完全沒有問題。2K分辨率更不用說了,輕松超過百幀,實力非常強悍。
另外我們還測試了DLSS3的性能表現。
在《極限競速:地平线5》這款遊戲中,TUF RTX 4080 SUPER OC在2K和4K分辨率中,开啓DLSS3相比DLSS2的提升分別爲33%和12%,效果非常明顯。
如今越來越多的遊戲开始支持RTX和DLSS技術,其中已經超過500款遊戲和應用支持RTX技術,支持DLSS3的遊戲數量也在快速攀升,目前已經有72款遊戲和應用支持DLSS3,未來包括《龍之信條2》、《灰區战爭》、《半條命2》RTX版、《地平线:西之絕境》和《層層恐懼》等遊戲,也將支持DLSS3技術,爲配備GeForce RTX 40 系列顯卡的遊戲玩家帶來前所未有的性能和更高的圖像質量。
六、生產力工具測試
在生產力工具上,我們測試了V-Ray渲染器,選擇使用GPU渲染的CUDA測試和RTX測試,成績分別爲4992vpaths、7278vpaths。
Blender是一款專業的三維渲染軟件,我們使用的是官方的Benchmark跑分軟件。軟件會自動渲染測試monster/junkshop/classroom共三個場景。TUF RTX 4080 SUPER OC顯卡得分分別爲4623/2163/2267分。
七、AIGC測試
目前AI的應用範圍越來越廣泛,相關算力也得到了大家的重視。目前NVIDIA推出了全新的TensorRT插件,可以充分調用Tensor算力。此次我們使用Stable Diffusion對TUF RTX 4080 SUPER OC在AIGC方面的性能進行測試。所有測試默認开啓xformers優化方案。
首先是較爲基礎的SD1.5模型測試,在SD1.5中模型的輸出分辨率爲512x512和768x768。我們將導出【TRT】引擎,並記錄使用默認模型渲染,以及【TRT】模型渲染的批次時間。
根據NVIDIA提供的統一參數進行輸出,以便記錄結果。其中採樣方式爲:Eulera;採樣步驟:50;Batch Count:10。
【默認SD1.5模型】TUF RTX 4080 SUPER OC 運算時間22.2s,約合2.22秒一張圖。
【TRTSD1.5模型】TUF RTX 4080 SUPER OC 運算時間14.9s,約合1.49秒一張圖。
第二次測試爲的SDXL模型測試,SDXL模型將在1024x1024分辨率進行訓練,相比SD1.5來說圖像大了2倍,它可以提供更准確的關鍵字匹配,從而獲得更真實的結果。但由於更高的原生分辨率和模型復雜性,SDXL模型的計算強度明顯更高。
我們按照相同的參數進行設置,但尺寸規定爲1024x1024,下面看看TUF RTX 4080 SUPER OC的表現如何。
【默認SDXL模型】TUF RTX 4080 SUPER OC 運算時間1m44.4s,約合10.44秒一張圖。
【TRT SDXL模型】TUF RTX 4080 SUPER OC 運算時間1m4.4s,約合6.44秒一張圖。
在更復雜的模型中,Tensor RT引擎的優勢愈發明顯,並且大顯存的特點得到充分體現,實測最高佔用達到了12GB顯存,TUF RTX 4080 SUPER OC的16GB顯存還有一定余量。
本次測試新增了ON1 Resize AI 2023的測試,這是一款AI圖像修復軟件,包括圖片縮放,內容填充等功能,同時它也可以作爲PS等軟件的插件形式存在,非常方便快捷。
測試選擇NVIDIA提供的5張高分辨率圖片進行,我們將在原圖片的尺寸上直接放大200%,可以看到放大後的圖片尺寸已經達到了12000x8000。
使用TUF RTX 4080 SUPER OC進行AI計算後,5張圖片最終用時34641ms,即35秒左右。
放大後使用NVIDIA ICAT進行對比,左側爲使用ON1 Resize AI 2023進行放大200%的圖片,可以看到在樹葉的紋理更加清晰。而右側則已經有一些模糊了。
AI對於日常生活的應用的確更加方便,在我們以往的認知中,圖片尺寸放大必然會損失質量。但經由AI的加持,反而更清晰,這對於老照片的修復,起到了更加便捷的作用。
八、RTX視頻超分辨率測試
另外我們還測試了RTX視頻超分辨率(RTX Video Super Resolution)這項功能,目前這項功能在B站和YouTube已經可以生效。當然,首先顯卡必須是RTX40或30系列GPU,並且驅動更新至最新版;其次,使用最新版的Google Chrome和Microsoft Edge瀏覽器。兩者都滿足之後,就可以體驗RTX視頻超分辨率帶來的優勢。
在NVIDIA控制面板中的【調整視頻圖像設置】,可以看到最新的RTX視頻增強,點擊質量下方的選框就可以選擇不同級別。在視頻全屏播放的時候,通過任務管理器看到GPU的負載提高,說明开啓成功。
在YouTube隨意觀看視頻,打开RTX VSR後,可以清晰明顯的看到水下珊瑚的質量明顯提高,邊緣更爲清晰,並且極大減少了失真現象。
不過需要說明一點的是,RTX視頻超分辨率對於低分辨率視頻的效果是比較明顯的,比如480P或720P,能夠明顯感知到RTX視頻超分辨率帶來的提升。但如果視頻分辨率在1080P以上,那么實際RTX視頻超分辨率帶來的提升,並不會特別明顯。
所以RTX視頻超分辨率功能比較適合應對網絡較差,或者視頻源本身並不清晰的情況。
九、溫度及功耗測試
功耗測試中,我們選擇FurMark軟件進行拷機測試,並採用GPU-Z檢測溫度,功耗僅計算顯卡自身。
可以看到TUF RTX 4080 SUPER OC這張顯卡的溫度穩定在62℃左右,熱點溫度在74℃左右;顯卡總功耗在313.6W。
考慮到實際遊戲負載不同,功耗是實時變化的,所以通過《光明記憶:無限》自帶的Benchmark,在光追最高、DLSS質量、2K分辨率下,記錄運行過程中顯卡的實際功耗表現。
從記錄的功耗曲线可以看到,TUF RTX 4080 SUPER OC在《光明記憶:無限》遊戲的Benchmark中,功耗基本可以穩定在300W左右,平均功耗爲293W。對於高端定位的顯卡來說,特別是對比上一代RTX30系顯卡,功耗並不算高。
十、總結
通過測試,其實大家也能夠看到,RTX 4080 SUPER的性能,相較於RTX4080,提升幅度其實並不大,綜合理論和遊戲實測,性能的提升幅度大約在4%左右。但這並不影響它會成爲未來一年高端顯卡中,消費者首選的那款。原因主要有兩個。
第一,RTX 4080 SUPER的性能,應對4K遊戲是完全沒有問題的,其性能表現可以說相當強悍,是目前能夠流暢運行4K遊戲的性能猛獸。同時在AI性能方面,表現強勁,16GB顯存也能夠應對絕大多數AIGC需求;
第二,RTX 4080 SUPER的定價,可以說是很多人沒有想到的,起售價居然比RTX 4080便宜了1400元。即使兩者在性能方面差距並不大,但便宜的1400元足以讓這款產品成爲更多玩家的高端首選。
回到TUF RTX 4080 SUPER OC身上。這款顯卡有着西裝暴徒的外觀設計,在性能表現方面可以完美應對4K遊戲,同時強悍的散熱設計讓其在壓力測試下,核心和熱點溫度也沒有超過75℃,整體表現可以說非常亮眼,是首批上市的RTX 4080 SUPER中不可忽視的一款產品。
標題:華碩TUF RTX 4080 SUPER O16G GAMING首測 高端首選 比4080更強但價格更低
地址:https://www.utechfun.com/post/326699.html