作爲目前RTX 40系最新的准旗艦,在性能上相比RTX 4080有小幅提升,最重要的是價格優惠了很多,也是這次SUPER系列唯一“加量降價”的型號。今天爲大家帶來的是影馳GeForce RTX 4080 SUPER星曜OC的評測。
在歷代顯卡中,80和90級產品都是最能體現出其性能實力的,甚至4K分辨率下的光追遊戲依舊不成問題。但奈何價格太貴,阻止了不少玩家換卡的欲望。現在加量降價的RTX 4080 SUPER來了,不知道大部分玩家如何看待?
本次測試的星曜顯卡是大家熟悉的老朋友了,其特點就是千層鏡面的設計風格以及純白卡身,下面我們簡單來看看影馳GeForce RTX 4080 SUPER星曜OC的外觀。
購买地址:https://store.szgalaxy.com/shoopdetails.html?goodsId=1181251
1 影馳GeForce RTX 4080 SUPER星曜OC 概覽
影馳星曜系列的包裝在整個“顯卡界”也是相當有個性的,從圖中能看到包裝整體的厚度並不像其他顯卡那么誇張,堪堪比一張顯卡厚一點,但長寬的尺寸較大,這也讓星耀娘的形象更飽滿生動。
影馳GeForce RTX 4080 SUPER星曜OC的卡身整體爲338×139×69mm(不帶擋板),經典的鑽石切割設計透明外殼,帶來水晶般的透明質地,而且上蓋支持DIY設計,玩家可自行拆下來進行塗鴉或者購买官方的可替換外殼,另外拆卸上蓋的操作並不影響售後質保。
(上圖爲RTX 4070星曜 替換後效果)
替換了外殼的星曜與原版星曜“判若兩人”,而且官方有多種設計風格可選,極大地提升了顯卡的可玩性。
影馳GeForce RTX 4080 SUPER星曜OC採用星卓III散熱系統,共有3個直徑102mm的三折風扇,每個風扇擁有11片靜霜扇葉,實現更強風力和更大風量;支持智能啓停,可同時提供高效散熱與靜音體驗。
影馳GeForce RTX 4080 SUPER星曜OC的採用一體壓鑄的金屬背板,設計元素均爲星曜系列logo,尾部大面積鏤空設計保障了散熱性能,白色噴塗搭配絲印工藝提升了整體的質感。
內部散熱上,這張RTX 4080 SUPER擁有4根8mm+5根6mm鍍鎳復合熱管,搭配大面積高效能均熱板和散熱鰭片,結合回流焊接工藝,帶來更強的散熱性能。
視頻輸出接口上,依舊採用了HDMI 2.1 + DP 1.4a*3的四接口設計。HDMI 2.1可支持4K 120Hz HDR、8K 60Hz HDR,對於目前階段的產品來說完全夠用。從側面也能看到影馳GeForce RTX 4080 SUPER星曜OC基本佔用3槽多一點的空間,有換卡需求的玩家還要注意電腦內的空間是否符合。
本次RTX 4080 SUPER的整卡功耗爲320W,採用單16pin的輔助供電,建議電源爲850W及以上。
2 NVIDIA GeForce RTX 4080 SUPER 架構淺析
本次發布的GeForce RTX 40系顯卡由全新的NVIDIA Ada Lovelace架構打造,採用TSMC 4N NVIDIA定制工藝,旗艦核心AD102達到了的760億個晶體管,而在RTX 30系顯卡中爲280億個。
與上一代NVIDIA Ampere相比,NVIDIA Ada Lovelace在相同功率下,具有2倍以上的性能提升,最高可達到90-TFLOPS的着色器數據吞吐量。
本次發布的RTX 4080 SUPER共有10240個CUDA核心,提供了52-TFLOPS算力;80個第三代Ada RT Core擁有121 RT-TFLOPS;320個第四代Tensor Core可提供836 Tensor-TFLOPS(AI TOPS)。
RTX 4080 SUPER的L2 Cache容量爲64MB,帶寬爲736 GB/s。NVIDIA官方也特別表明了L2 Cache的重要性,我們以兩張圖來簡單說明L2緩存的作用。
在真正的GPU中,內核是所有計算發生的地方,而這就是L1數據緩存的作用所在。每個SM都有一個超低延遲的L1數據緩存,緊挨其處理內核,使L1成爲GPU尋找信息的首選。然而由於L1緩存需要離內核非常近,不可能非常大。
如果在L1緩存中找不到內核計算所需的數據,GPU將在L2數據緩存中尋找。這個顯存系統位於GPU芯片上,並通過一個非常高速的橫梁系統連接到所有的GPC(圖形處理集群),每個GPC包括多個SM。如果在L2緩存中找到了信息,那么GPU就挑出這些數據並將其放入內核。
如果在L2緩存中找不到信息(被稱爲緩存缺失),那么GPU將通過顯存接口在VRAM中尋找。這在整個GPU存儲子系統中產生了很多額外的工作量,並降低了性能和功耗效率。
更多詳細的參數,我們爲大家總結出了一張表格,可以看到從各方面的規格來說,這張RTX 4080 SUPER更接近於RTX 4080,距離卡皇RTX 4090還有很大差距。
另外最主要的價格方面,相比RTX 4080的建議售價足足便宜了1400元,一方面有RTX 40系首發定價過高的原因,但本次SUPER系列的升級也顯出了足夠的誠意,下面我們直接看測試成績。
3 測試平台簡介
首先介紹一下測試平台,爲了保障影馳GeForce RTX 4080 SUPER星曜OC的性能發揮,我們的平台採用上一代旗艦處理器i9-13900k。
下面還是來看看本次評測的顯卡參數,目前最新的GPU-Z爲2.57版本,參數識別較爲詳細。
影馳GeForce RTX 4080 SUPER星曜OC擁有10240個CUDA,Boost頻率爲2610MHz,對比公版的2550MHz更高,基礎頻率和顯存頻率都相同。
採用16GB GDDR6X顯存,位寬爲256bit,這裏值得注意的是,雖然顯存位寬RTX 4080 SUPER與RTX 4080相同,但顯存頻率則是剛剛發布的SUPER顯卡更高,所以整體帶寬相對於RTX 4080的716 GB/s也要更高。
光柵單元和紋理單元爲112和320,其中光柵單元RTX 4080 SUPER與RTX 4080相同,但紋理單元更多。
4 理論性能測試
本次測試影馳GeForce RTX 4080 SUPER星曜OC主要對比它的上下型號,RTX 4080以及RTX 4090。
下面先進行的是用來衡量顯卡DX11理論性能的3DMARKFS套裝:FS,FSE,FSU三者分別對應顯卡在1080P、2K、4K的理論性能,取顯卡分數實際測試結果如下:
在FS測試中,影馳GeForce RTX 4080 SUPER星曜OC相比RTX 4080,其中FS提升4%;FSE提升5%;FUS提升5%,綜合提升5%。對比RTX 4090,綜合成績相差20%左右。
而在針對DX12環境下的Time Spy和Time Spy Extreme測試中,影馳GeForce RTX 4080 SUPER星曜OC相較RTX 4080的提升分別爲:TS提升3%;TSE提升3%,綜合約爲3%。對比RTX 4090,綜合成績相差25%左右。
PortRoyal是3DMARK中專門針對光追性能的測試項,影馳GeForce RTX 4080 SUPER星曜OC相較RTX 4080的提升約爲6%。對比RTX 4090,相差27%左右。
下面我們再來看看3DMARK中新增的一些具體應用場景的測試。
Speed Way這項測試結合了實時光线追蹤和傳統渲染技術來測量顯卡性能。場景含有光线追蹤反射、實時全局光照、網格着色器、體積照明、粒子和後處理效果。所以SW的測試基本可以看做次世代3A遊戲基准。
影馳GeForce RTX 4080 SUPER星曜OC對比RTX 4080,從1080p分辨率到8K提升依次爲:5%/6%/7%/5%。
另外我們使用3DMARK剛剛更新的DLSS 3進行了相關性能測試。
這一項測試更偏向實際的遊戲幀數跑分,所以整體基數較小,影馳GeForce RTX 4080 SUPER星曜OC的綜合提升依然在5%左右,不過反映到實際幀數則並不明顯。
從整體的理論測試成績來看,傳統的FS/TS/PR三項測試,影馳GeForce RTX 4080 SUPER星曜OC相比RTX 4080綜合提升約爲5%左右;相比RTX 4090的差距在24%左右,而最新的SW綜合測試也基本呈現相同的結果。
5 常規遊戲 性能測試
由於本次RTX 40系加入了DLSS 3新技術,所以後面會進行單獨測試,這裏依然選擇主流的幾款3A大作進行遊戲性能對比。
首先我們測試了《幻獸帕魯》,這款遊戲自帶DLSS。另外遊戲雖然採用了虛幻引擎制作,但目前EA階段遊戲內容整體還是比較糙的,所以對於顯卡的要求並沒有很高。
我們選擇最高畫質進行幀數實測,影馳GeForce RTX 4080 SUPER星曜OC在4K分辨率下都能達到較高的幀率。
《幻獸帕魯》遊戲共有5個畫質檔位,其中最高和最低差距較大,主要區別在於光线渲染、抗鋸齒和植被,在材質和貼圖方面差別較小。
接下來便是一些老朋友,在《極限競速:地平线5》中,其中影馳GeForce RTX 4080 SUPER星曜OC相比RTX 4080提升較爲明顯,不過在1080p分辨率下受制於CPU瓶頸,三款顯卡的分數幾乎相同,2K分辨率下RTX 4090依然能夠摸到CPU瓶頸,而4K分辨率則能夠較好的反映出三款顯卡的真實水平。
在《刺客信條:幻景》中,影馳GeForce RTX 4080 SUPER星曜OC相比RTX 4080的提升分別爲:1080p提升4%;2K提升5%;4K提升7%,綜合提升5%。
在《無主之地3》中,影馳GeForce RTX 4080 SUPER星曜OC相比RTX 4080的提升分別爲:1080p提升10%;2K提升9%;4K分辨率提升10%,綜合提升10%。
《光明記憶:無限》的光追測試軟件是獨立於遊戲的測試工具,比遊戲中用到的光线追蹤技術更多,測試條件爲“RTX最高/DLSS質量”。
性能方面,影馳GeForce RTX 4080 SUPER星曜OC相比RTX 4080的提升分別爲:1080p提升10%;2K提升8%;4K提升4%,綜合提升7%。
在另外一款國產遊戲《邊境》的跑分軟件中,情況基本與《光明記憶:無限》相同,測試條件均在“RTX最高/DLSS質量”下進行。
在《邊境》中,影馳GeForce RTX 4080 SUPER星曜OC相比RTX 4080的提升分別爲:1080p提升12%;2K提升7%;4K提升8%,綜合提升9%。
在“遊戲測試標杆”的《賽博朋克2077》中,由於增加了最新的光追超速模式,成績比較多,我們分別對比不同模式下的幀數。
影馳GeForce RTX 4080 SUPER星曜OC在1080p分辨率下光追超速模式可以達到100幀的成績,《賽博朋克2077》中的超速模式被譽爲光线追蹤的終極形態,添加了全新的路徑追蹤,效果相比光追超級模式也有了質的飛躍。
在2K分辨率下,光追超級模式同樣能夠達到百幀,光追超速模式則能夠達到70幀的流暢水准。最後的測試中我們在《賽博朋克2077》體會一下不同的光影模式。
從上至下依次爲超級畫質/光追超級/光线追蹤:超速模式。可以看到光线追蹤:超速模式相比光追超級更貼近於真實效果。它模擬了真實的光线路徑,其實相比之前的光线追蹤模擬了更多光线在不同表面的反射,完整的計算出了場景的真實光照,避免了上一代光追中出現“死黑”的情況。
另外《賽博朋克2077》更新了DLSS 3.5,支持光线重建技術。在上面的測試圖中不難發現,光线重建能夠更加精准的計算出反射部分的效果,接近於亮面金屬表面的反射中,未开啓RTX能夠看出畫質明顯的區別,不再贅述。重點在於DLSS 3.5的开關效果,除了廣告牌上所顯示的內容更清晰外,放大後能夠看到遠處電线以及工業區建築的細節外觀。
6 DLSS 3性能測試
截止目前,超過 530 款遊戲和應用已支持 RTX 技術。
其中《龍之信條 2》、《灰區战爭》、《半條命 2》RTX 版、《地平线:西之絕境》、《層層恐懼》、《人中之龍7外傳:無名之龍》、《人中之龍8》、《納克園:最後的樂園》、《Pax Dei》、《星際礦工》和《王權與自由》均將支持 DLSS 3 技術,其中有些遊戲將在今年發布,有些遊戲則將在今年更新對 DLSS 3 的支持,爲配備 GeForce RTX 40 系列顯卡的遊戲玩家帶來前所未有的性能和更高的圖像質量。
本次DLSS 3增加了1% Low FPS和延遲的測試,1% Low FPS則是將一段時間內的幀數從大到小排列,取最小的1%出來,再對這1%的數求平均值。
本次我們分別對《賽博朋克2077》,在三檔畫質下進行了DLSS 3的幀數測試,所有檔位均开啓DLSS質量記錄幀數。
DLSS 3技術主要針對於CPU瓶頸的遊戲,所以也能夠看到在越低的分辨率,幀數提升越大,其中1080p能夠達到40%左右。
《星空》在1.8.86大版本更新後,加入了DLSS 3,整體來看效果非常好,即便在4K分辨率下也能夠達到113幀的流暢水准。
其中1080p分辨率下DLSS 3相比DLSS 2提升達到44%;2K分辨率提升55%;4K分辨率提升45%。
《地平线5》也是顯卡測試的老朋友了,其出色的優化讓很多入門級產品都能跑出較高的幀率。在影馳GeForce RTX 4080 SUPER星曜OC也有較明顯的體現。在3種分辨率中,开啓DLSS 3相比DLSS 2的提升分別爲41%/29%/13%。
最後我們也測試了《巫師3:狂獵》,這款遊戲在加入了光线追蹤後,對於配置的要求直线上升,即便是RTX 4080 SUPER在關閉DLSS時,也僅有39幀的成績。
其中影馳GeForce RTX 4080 SUPER星曜OC在4K分辨率下,开啓DLSS 3相比關閉DLSS,提升達到了144%;相比DLSS 2的提升也達到了44%。另外在开啓DLSS 3後會強制开啓Reflex Boost,能夠大幅減少畫面延遲。
7 生產力工具測試
D5渲染器
D5是一款國內實時光线追蹤渲染器,支持多種建模軟件直讀,包括SketchUp、3Ds MAX、Rhino、Revit、Archicad、Blender、C4D等。目前也已經支持DLSS 3,下面我們分別看看幀數和功耗的情況。
選擇軟件自帶的默認場景【簡約客廳】
在實時幀數表現上,由於D5採用實時GPU渲染,所以壓力全在顯卡。可以看到在4K分辨率下,即便是影馳GeForce RTX 4080 SUPER星曜OC僅有21幀。而开啓DLSS 3後,幀數提升可達到267%左右,非常暴力。
功耗方面,影馳GeForce RTX 4080 SUPER星曜OC的TDP爲320W。關閉DLSS的情況下,實際平均使用功耗爲286W,而在开啓DLSS 3後,功耗僅有246W。
8 AIGC測試
AI時代不知何時已經離人們的生活越來越近,小到文本改寫,大到各種生成式AI。此前我們已經測試過Stable Diffusion的AI繪圖能力,不過目前NVIDIA推出了全新的TensorRT插件,可以充分調用Tensor算力,下面我們來測試一下影馳GeForce RTX 4080 SUPER星曜OC在這方面的性能表現。
【注:所有測試默認开啓xformers優化方案】
首先是較爲基礎的SD1.5模型測試,在SD1.5中模型的輸出分辨率爲512×512和768×768。我們將導出【TRT】引擎,並記錄使用默認模型渲染,以及【TRT】模型渲染的批次時間。
根據NVIDIA提供的統一參數進行輸出,以便記錄結果。其中採樣方式爲:Euler a;採樣步驟:50;Batch Count:10
【默認SD1.5模型】影馳GeForce RTX 4080 SUPER星曜OC 運算時間 21.5s 約合 2.15秒一張圖
【TRT SD1.5模型】影馳GeForce RTX 4080 SUPER星曜OC 運算時間 14.2s 約合 1.42秒一張圖
第二次測試爲的SDXL模型測試,SDXL模型將在1024×1024分辨率進行訓練,相比SD1.5來說圖像大了2倍,它可以提供更准確的關鍵字匹配,從而獲得更真實的結果。但由於更高的原生分辨率和模型復雜性,SDXL模型的計算強度明顯更高。
我們按照相同的參數進行設置,但尺寸規定爲1024×1024,下面看看影馳GeForce RTX 4080 SUPER星曜OC的表現如何。
【默認SDXL模型】影馳GeForce RTX 4080 SUPER星曜OC 運算時間 1m43.8s 約合 10.38秒一張圖
【TRT SDXL模型】影馳GeForce RTX 4080 SUPER星曜OC 運算時間 1m10.8s 約合 7.08秒一張圖
在更復雜的模型中,TensorRT引擎的優勢愈發明顯,單張圖片的出圖速度能夠提高3秒左右。
生成式AI對於普通用戶來說,可以讓沒有繪畫功底的人,獨立創作出一幅不亞於藝術家的作品,讓每個人都成爲自己生活中的藝術家。
9 RTX 視頻超分辨率(RTX Video Super Resolution)測試
目前RTX 視頻超分辨率(RTX Video Super Resolution)已經在部分瀏覽器中進行測試,首先玩家需要更新到NVIDIA最新驅動,在NVIDIA控制面板中的【調整視頻圖像設置】可以看到最新的RTX 視頻增強超分辨率。
除了RTX視頻超分辨率,目前在NVIDIA控制面板中,還新增了HDR高動態範圍視頻的選項。想要开啓HDR效果首先需要顯示器自身支持HDR,在啓用顯示器HDR效果後,該選項會亮起。
勾選後用戶在上網瀏覽時,會直接觀看到優化後的視頻,並且它在窗口狀態下即可直接生效,相當於把普通SDR視頻直接轉換成了HDR視頻,有HDR顯示器的用戶不妨試試這一效果。
回到正題,RTX 視頻超分辨率是 AI 圖像處理的突破,它超越了傳統的邊緣檢測和特徵銳化技術,極大地提升直播視頻內容的質量。
开啓RTX 視頻超分辨率不僅需要最新版驅動,還需要使用RTX 40或30系列GPU,並且幾乎適用於Google Chrome和Microsoft Edge瀏覽器中的所有視頻內容(瀏覽器也需要更新到最新版本)。
开啓後,目前已知的打开YouTube或者B站,都可以享受到RTX VSR效果的加成。
如果不確定,在全屏播放視頻時,可以打开任務管理器,看到GPU負載增加,即爲开啓成功。
我們打开YouTube隨意觀看視頻,在打开RTX VSR後,可以清晰明顯的看到水下珊瑚的質量明顯提高,邊緣更爲清晰,並且極大減少了失真現象。
(點擊放大查看原圖)
在下面這幅圖的對比中,可以明顯看到开啓RTX 視頻超分辨率後,胡須明顯更順滑,已經看不出馬賽克。
不過需要注意的是,RTX 視頻超分辨率在低分辨率下效果會更明顯,如果本身觀看的視頻爲1080p或2K以上,則基本很難看出區別。
這對於一些網速不夠快,只能看低分辨率視頻的用戶,或者視頻片源本身不夠清晰的情況,幫助非常大。
10 溫度及功耗測試
功耗測試中,我們選擇FurMark軟件進行拷機測試,並採用GPU-Z檢測溫度,功耗僅計算顯卡自身。
可以看到影馳GeForce RTX 4080 SUPER星曜OC這張顯卡通過40分鐘左右的拷機測試,溫度在63℃左右,熱點溫度在72℃左右,滿載拷機達到320W。對於一張准旗艦顯卡來說,這個溫度控制已經非常優秀了。這對於很多常玩3A遊戲或內容創作者高強度渲染來說,都將有着更穩定的表現和更長久的壽命。
遊戲動態功耗測試
本次我們在拷機測試中最大板載功耗爲320W左右。不過由於不同遊戲負載不同,GPU的實際功耗是動態變化的,類似於FPS隨時間的變化,RTX 40系列很難觸及功耗牆。
影馳GeForce RTX 4080 SUPER星曜OC 3A遊戲平均功耗
在實際的遊戲功耗測試中,我們選擇《光明記憶:無限》自帶benchmark,光追最高、DLSS質量、4K分辨率,來拉滿顯卡的性能極限,檢測我們實際應用場景的功耗。
可以看到影馳GeForce RTX 4080 SUPER星曜OC平均功耗爲289W,在實機測試中,基本達不到320W的峰值功耗。
11 加量降價 可遊戲可AI
本次RTX 4080 SUPER升級的最大特點就是加量降價了,雖然相比兩張70級別產品的增量不多,但依然是有提升的。而且在原來9499元的基礎上降價幅度非常大,性價比提升顯著。
綜合性能來說,這張影馳GeForce RTX 4080 SUPER星曜OC相比RTX 4080的提升在5%左右,相比RTX 4090的差距在25%左右。
作爲一款80級產品,它定位4K分辨率下傳統3A遊戲電競級幀率,即便是光追遊戲,在4K分辨率下也能夠達到流暢的水准。
而在AI方面,雖然RTX 4070 Ti SUPER和RTX 4080 SUPER都是16GB顯存,但憑借更高的算力,在SD中的出圖速度相比RTX 4070 Ti SUPER最高可提升30多秒。
可以說影馳GeForce RTX 4080 SUPER星曜OC不僅是一張遊戲旗艦顯卡,更是一張可在AI領域中位列第一梯隊的創作卡。
星曜系列,大家應該都比較熟悉了,就不再贅述其特點。關於可替換外殼,我翻看了影馳旗艦店和小程序商城,目前RTX 4080 SUPER型號尚無售賣,畢竟每個型號的尺寸不同就需要重新定制,大家也可以時刻關注影馳官方商城成。
本次評測的影馳GeForce RTX 4080 SUPER星曜OC目前在旗艦店和各大電商均有售賣,有興趣的不妨前去了解。
購买地址:https://store.szgalaxy.com/shoopdetails.html?goodsId=1181251
標題:影馳RTX 4080 SUPER星曜OC評測 加量降價 可遊戲可AI
地址:https://www.utechfun.com/post/347903.html