微星RTX 4070 SUPER 12G 魔龍姬顯卡評測 定制背板玩法多

2024-03-06 18:35:24    編輯: robot
導讀 不久前NVIDIA發布了RTX 40 SUPER系列,共3張顯卡,均爲加量不加價或加量降價。下面爲大家帶來的是,個人認爲該系列最值得購买的RTX 4070 SUPER——微星GeForce RTX ...

不久前NVIDIA發布了RTX 40 SUPER系列,共3張顯卡,均爲加量不加價或加量降價。下面爲大家帶來的是,個人認爲該系列最值得購买的RTX 4070 SUPER——微星GeForce RTX 4070 SUPER 12G GAMING X SLIM MLG顯卡的評測。

目前本系列降價最多的RTX 4080 SUPER相比RTX 4080直降1400元,但考慮到其本身的定位,依然價格不菲,大概率只有發燒級玩家才會配備。

而今天評測的RTX 4070 SUPER,官方建議售價爲4899元,仍在大部分3A遊戲玩家的承受範圍之內。而且在國內雖然它只比RTX 4070貴了100元,但性能堪稱質的飛躍,具體相差有多大,下面我們直接看測試。

本次測試的顯卡爲微星最新推出的魔龍姬IP產品,相比其他系列更活潑,下面先來看看外觀。

1 微星GeForce RTX 4070 SUPER 12G GAMING X SLIM MLG概覽

本次微星GeForce RTX 4070 SUPER 12G GAMING X SLIM MLG(以下簡稱微星GeForce RTX 4070 SUPER 12G 魔龍姬)採用了該系列IP的獨立包裝,魔龍姬端坐於畫面正中心,整體背景均爲紅色。

魔龍姬系列顯卡在包裝內不僅附贈了供電轉接线以及顯卡支架,還有魔龍姬的立繪貼紙和Q版的卡通貼紙,可以貼在機箱或其他擺件上。除此之外,還有一個魔龍姬金屬背板,這個一會兒我們後面直接看效果。

下面先來看顯卡本體,微星GeForce RTX 4070 SUPER 12G 魔龍姬的整體尺寸約爲307×125×46mm,佔用2槽空間,作爲一款中高端產品來說,它的厚度控制的比較出色。

微星GeForce RTX 4070 SUPER 12G 魔龍姬的整體造型與原版的魔龍基本相同,導流罩均採用了不規則幾何面覆蓋,不過爲了搭配魔龍姬這個原創的二次元IP,色調採用了魔焰紅。

散熱方面,微星GeForce RTX 4070 SUPER 12G 魔龍姬整體採用了TRI-FROZR 3散熱模組。主動散熱的風扇部分,採用刀鋒7代風扇,它採用三組傾斜22度的扇葉連成環形,慢轉速下也能保持高壓氣流。而在扇葉外側,還新增了特殊構造風扇罩,大幅提高氣流穩定性並能降低噪音。

內部散熱微星GeForce RTX 4070 SUPER 12G 魔龍姬採用鍍鎳銅底座,緊密貼合GPU核心和顯存顆粒,可將其產生的熱量迅速傳導到熱管上。搭配特制的方形核心熱管,進一步把熱量傳導至整個散熱鰭片。

另外該顯卡的散熱鰭片採用交錯的波浪形鰭片2.0,可快速引導氣流導出,而升級後的導流板等設計優化了散熱和安靜之間的平衡。

微星GeForce RTX 4070 SUPER 12G 魔龍姬顯卡默認的背板,採用了常規的黑色一體式金屬背板,從右側鏤空的進氣格柵能看到大量散熱鰭片以及熱管。

不過作爲魔龍姬IP產品,自然不會甘於那么樸素,包裝內附贈的魔龍姬金屬背板採用磁吸的方式,玩家只需把背板靠在顯卡背面,即可自動貼合,方便快捷。

視頻輸出接口上,依舊採用了HDMI 2.1 + DP 1.4a*3的四接口設計。HDMI 2.1可支持4K 120Hz HDR、8K 60Hz HDR。從側面可以看出微星GeForce RTX 4070 SUPER 12G 魔龍姬顯卡在該型號中,也算是相當輕薄的。

微星GeForce RTX 4070 SUPER 12G 魔龍姬顯卡側面可以看到16pin供電接口,它的TDP功耗爲245W,建議電源650W及以上。不過16pin接口可支持單路600W輸出,這接口着實有點浪費。

另外使用微星的魔龍姬顯卡,下載MSI Center後可以使用專屬的主題UI,大家千萬不要錯過,又純又欲的小魔龍可比那些死板的背景好看多了。

2 NVIDIA GeForce RTX 4070 SUPER 架構淺析

本次發布的GeForce RTX 40系顯卡由全新的NVIDIA Ada Lovelace架構打造,採用TSMC 4N NVIDIA定制工藝,旗艦核心AD102達到了的760億個晶體管,而在RTX 30系顯卡中爲280億個。


與上一代NVIDIA Ampere相比,NVIDIA Ada Lovelace在相同功率下,具有2倍以上的性能提升,最高可達到90-TFLOPS的着色器數據吞吐量。

本次發布的RTX 4070 SUPER共有7168個CUDA核心,提供了35.5-TFLOPS算力;56個第三代Ada RT Core擁有82.1 RT-TFLOPS;224個第四代Tensor Core可提供568 Tensor-TFLOPS(AI TOPS)

RTX 4070 SUPER的L2 Cache容量爲48MB,帶寬爲504 GB/s。NVIDIA官方也特別表明了L2 Cache的重要性,我們以兩張圖來簡單說明L2緩存的作用。


在真正的GPU中,內核是所有計算發生的地方,而這就是L1數據緩存的作用所在。每個SM都有一個超低延遲的L1數據緩存,緊挨其處理內核,使L1成爲GPU尋找信息的首選。然而由於L1緩存需要離內核非常近,不可能非常大。


如果在L1緩存中找不到內核計算所需的數據,GPU將在L2數據緩存中尋找。這個顯存系統位於GPU芯片上,並通過一個非常高速的橫梁系統連接到所有的GPC(圖形處理集群),每個GPC包括多個SM。如果在L2緩存中找到了信息,那么GPU就挑出這些數據並將其放入內核。

如果在L2緩存中找不到信息(被稱爲緩存缺失),那么GPU將通過顯存接口在VRAM中尋找。這在整個GPU存儲子系統中產生了很多額外的工作量,並降低了性能和功耗效率。


更多詳細的參數,我們爲大家總結出了一張表格,可以看到從各方面的規格來說,這張RTX 4070 SUPER更接近於RTX 4070 Ti,但功耗相比RTX 4070只提升了20W。

另外最主要的價格方面,相比RTX 4070的建議售價只貴了100元,下面我們直接看測試成績。

3 測試平台簡介

首先介紹一下測試平台,爲了保障微星GeForce RTX 4070 SUPER 12G 魔龍姬的性能發揮,我們的平台採用了最新的i9-14900K。

下面還是來看看本次評測的顯卡參數,目前最新的GPU-Z爲2.57版本,參數識別較爲詳細。

微星GeForce RTX 4070 SUPER 12G 魔龍姬擁有7168個CUDA,Boost頻率爲2640MHz,而公版爲2475MHz,有較大提升。顯存方面,12GB GDDR6X顯存,位寬爲192bit,顯存帶寬504 GB/s,光柵單元和紋理單元爲80和224。

4 理論性能測試

本次測試微星GeForce RTX 4070 SUPER 12G 魔龍姬主要對比它的上下型號,RTX 4070 Ti以及RTX 4070。

下面先進行的是用來衡量顯卡DX11理論性能的3DMARKFS套裝:FS,FSE,FSU三者分別對應顯卡在1080P、2K、4K的理論性能,取顯卡分數實際測試結果如下:

在FS測試中,微星GeForce RTX 4070 SUPER 12G 魔龍姬相比RTX 4070,其中FS提升17%;FSE提升18%;FUS提升25%,綜合提升20%。對比RTX 4070 Ti,綜合成績相差4%左右。

而在針對DX12環境下的Time Spy和Time Spy Extreme測試中,微星GeForce RTX 4070 SUPER 12G 魔龍姬相較RTX 4070的提升分別爲:TS提升18%;TSE提升19%,綜合約爲19%。對比RTX 4070 Ti,綜合成績相差4%左右。

PortRoyal是3DMARK中專門針對光追性能的測試項,微星GeForce RTX 4070 SUPER 12G 魔龍姬相較RTX 4070的提升約爲18%。對比RTX 4070 Ti,相差3%左右。

下面我們再來看看3DMARK中新增的一些具體應用場景的測試。

Speed Way這項測試結合了實時光线追蹤和傳統渲染技術來測量顯卡性能。場景含有光线追蹤反射、實時全局光照、網格着色器、體積照明、粒子和後處理效果。所以SW的測試基本可以看做次世代3A遊戲基准。

微星GeForce RTX 4070 SUPER 12G 魔龍姬對比RTX 4070,從1080p分辨率到4K提升依次爲:17%/18%/18%

而對比RTX 4070 Ti的成績幾乎持平,差距不超過1%,整體來看,這張RTX 4070 SUPER基本有着媲美RTX 4070 Ti的性能。

在DLSS 3的理論測試中,微星GeForce RTX 4070 SUPER 12G 魔龍姬在2K分辨率下DLSS开關相比RTX 4070的提升爲16%/20%;4K分辨率,提升約爲16%/22%

從整體的理論測試成績來看,傳統的FS/TS/PR三項測試,微星GeForce RTX 4070 SUPER 12G 魔龍姬相比RTX 4070綜合提升約爲19%左右;相比RTX 4070 Ti的差距在3%左右,

不過在最新的SW綜合測試中,這張RTX 4070 SUPER基本已經達到了RTX 4070 Ti的水准,下面我們在遊戲中實際看看它的表現。

5 常規遊戲 性能測試

由於本次RTX 40系加入了DLSS 3新技術,所以後面會進行單獨測試,這裏依然選擇主流的幾款3A大作進行遊戲性能對比。

在《極限競速:地平线5》中,其中微星GeForce RTX 4070 SUPER 12G 魔龍姬相比RTX 4070提升明顯,達到12%,2K分辨率提升15%;4K分辨率提升17%,綜合提升15%

在《刺客信條:幻景》中,微星GeForce RTX 4070 SUPER 12G 魔龍姬相比RTX 4070的提升分別爲:1080p提升8%;2K提升9%;4K提升13%,綜合提升10%

在《無主之地3》中,微星GeForce RTX 4070 SUPER 12G 魔龍姬相比RTX 4070的提升分別爲:1080p提升19%;2K提升16%;4K分辨率提升14%,綜合提升16%

《光明記憶:無限》的光追測試軟件是獨立於遊戲的測試工具,比遊戲中用到的光线追蹤技術更多,測試條件爲“RTX最高/DLSS質量”。

性能方面,微星GeForce RTX 4070 SUPER 12G 魔龍姬相比RTX 4070的提升分別爲:1080p提升18%;2K提升24%;4K提升26%,綜合提升23%

在另外一款國產遊戲《邊境》的跑分軟件中,情況基本與《光明記憶:無限》相同,測試條件均在“RTX最高/DLSS質量”下進行。

在《邊境》中,微星GeForce RTX 4070 SUPER 12G 魔龍姬相比RTX 4070的提升分別爲:1080p提升17%;2K提升18%;4K提升19%,綜合提升18%

在“遊戲測試標杆”的《賽博朋克2077》中,微星GeForce RTX 4070 SUPER 12G 魔龍姬在超級畫質下,2K分辨率百幀完全沒有問題的;在光追超級畫質下2K流暢運行同樣沒有問題;而作爲次世代光追體驗的超速模式中,2K分辨率下只有52幀。

不過不必着急,上面我們的測試均爲DLSS 2模式,尚未开啓DLSS 3,下面在DLSS 3的專項測試中,能夠看到幀數上的飛躍。

下面體會一下《賽博朋克2077》中不同的光影模式。




從上至下依次爲超級畫質/光追超級/光线追蹤:超速模式。可以看到光线追蹤:超速模式相比光追超級更貼近於真實效果。它模擬了真實的光线路徑,其實相比之前的光线追蹤模擬了更多光线在不同表面的反射,完整的計算出了場景的真實光照,避免了上一代光追中出現“死黑”的情況。

另外《賽博朋克2077》更新了DLSS 3.5,支持光线重建技術。在上面的測試圖中不難發現,光线重建能夠更加精准的計算出反射部分的效果,接近於亮面金屬表面的反射中,未开啓RTX能夠看出畫質明顯的區別,不再贅述。重點在於DLSS 3.5的开關效果,除了廣告牌上所顯示的內容更清晰外,放大後能夠看到遠處電线以及工業區建築的細節外觀。

6 DLSS 3性能測試

截止目前,超過 500 款遊戲和應用已支持 RTX 技術。

其中《龍之信條 2》、《灰區战爭》、《半條命 2》RTX 版、《地平线:西之絕境》、《層層恐懼》、《人中之龍7外傳:無名之龍》、《人中之龍8》、《納克園:最後的樂園》、《Pax Dei》、《星際礦工》和《王權與自由》均支持 DLSS 3 技術,其中有些遊戲將在今年發布,有些遊戲則將在今年更新對 DLSS 3 的支持,爲配備 GeForce RTX 40 系列顯卡的遊戲玩家帶來前所未有的性能和更高的圖像質量。


本次DLSS 3增加了1% Low FPS和延遲的測試,1% Low FPS則是將一段時間內的幀數從大到小排列,取最小的1%出來,再對這1%的數求平均值。

本次我們分別對《賽博朋克2077》,在三檔畫質下進行了DLSS 3的幀數測試,所有檔位均开啓DLSS質量記錄幀數。

可以看到在2K分辨率下,在是光追超速模式,开啓DLSS 3後微星GeForce RTX 4070 SUPER 12G 魔龍姬能達到80幀的成績,已經是流暢運行標准。

另外DLSS 3技術主要針對於CPU瓶頸的遊戲,所以也能夠看到在越低的分辨率,幀數提升越大,其中光追超速的1080p分辨率能夠達到53%左右。

《星空》經歷了首發後的低迷和差評,近期反響還不錯,在1.8.86大版本更新後,加入了DLSS 3,這也讓手持N卡的用戶終於不用再开啓FSR了,整體來看效果非常好。

其中1080p分辨率下DLSS 3相比DLSS 2提升達到62%;2K分辨率提升51%;4K分辨率提升42%。不難看出在越低的分辨率,也就是CPU瓶頸下,DLSS 3的幀生成加成越大。

雖然目前《星空》飽受批評的頻繁讀圖依然沒有修改,但至少使用N卡的用戶,畫面流暢度能夠大幅提升了。

《地平线5》也是顯卡測試的老朋友了,其出色的優化讓很多入門級產品都能跑出較高的幀率。在微星GeForce RTX 4070 SUPER 12G 魔龍姬也有較明顯的體現。在3種分辨率中,开啓DLSS 3相比DLSS 2的提升分別爲39%/27%/10%

最後我們也測試了《巫師3:狂獵》,這款遊戲在加入了光线追蹤後,對於配置的要求直线上升,幾乎達到了不开DLSS無法流暢遊戲的地步。其中微星GeForce RTX 4070 SUPER 12G 魔龍姬开啓DLSS 3相比關閉DLSS,提升達到了129%;相比DLSS 2的提升也達到了47%。

7  生產力工具測試

V-Ray

在生產力工具上,我們測試了最新版本的V-Ray渲染器,選擇使用GPU渲染的CUDA測試和RTX測試,成績如圖。

Blender

Blender是一款專業的三維渲染軟件,目前推出了固定的benchmark跑分軟件,省去了安裝軟件下載素材的麻煩。軟件會自動渲染測試monster/junkshop/classroom共三個場景。

上圖爲微星GeForce RTX 4070 SUPER 12G 魔龍姬顯卡得分,分別爲3328/1561/1664分,平均2184分。

D5渲染器

D5是一款國內實時光线追蹤渲染器,支持多種建模軟件直讀,包括SketchUp、3Ds MAX、Rhino、Revit、Archicad、Blender、C4D等。目前也已經支持DLSS 3,下面我們分別看看幀數和功耗的情況。


選擇軟件自帶的默認場景【簡約客廳】

在實時幀數表現上,由於D5採用實時GPU渲染,所以壓力全在顯卡。可以看到在4K分辨率下,微星GeForce RTX 4070 SUPER 12G 魔龍姬是PPT的狀態,而开啓DLSS 3後,幀數提升可達到462%左右,非常暴力。

功耗方面,微星GeForce RTX 4070 SUPER 12G 魔龍姬的TDP爲245W。關閉DLSS的情況下,實際平均使用功耗爲208W,而在开啓DLSS 3後,功耗僅有170W。更低的功耗,更高的幀數,可以說DLSS 3不僅對於遊戲玩家有非常大的幫助,對於內容創作者來說,也是1+1>2的效果。

8  AIGC測試

AI時代不知何時已經離人們的生活越來越近,小到文本改寫,大到各種生成式AI。此前我們已經測試過Stable Diffusion的AI繪圖能力,不過目前NVIDIA推出了全新的TensorRT插件,可以充分調用Tensor算力,下面我們來測試一下微星GeForce RTX 4070 SUPER 12G 魔龍姬在這方面的性能表現。

【注:所有測試默認开啓xformers優化方案】


首先是較爲基礎的SD1.5模型測試,在SD1.5中模型的輸出分辨率爲512×512和768×768。我們將導出【TRT】引擎,並記錄使用默認模型渲染,以及【TRT】模型渲染的批次時間。

根據NVIDIA提供的統一參數進行輸出,以便記錄結果。其中採樣方式爲:Euler a;採樣步驟:50;Batch Count:10

【默認SD1.5模型】微星GeForce RTX 4070 SUPER 12G 魔龍姬 運算時間 40.6s 約合 4.06秒一張圖

【TRT SD1.5模型】微星GeForce RTX 4070 SUPER 12G 魔龍姬 運算時間 31.3s 約合 3.13秒一張圖


第二次測試爲的SDXL模型測試,SDXL模型將在1024×1024分辨率進行訓練,相比SD1.5來說圖像大了2倍,它可以提供更准確的關鍵字匹配,從而獲得更真實的結果。但由於更高的原生分辨率和模型復雜性,SDXL模型的計算強度明顯更高。

我們按照相同的參數進行設置,但尺寸規定爲1024×1024,下面看看微星GeForce RTX 4070 SUPER 12G 魔龍姬的表現如何。

【默認SDXL模型】微星GeForce RTX 4070 SUPER 12G 魔龍姬 運算時間 2m49.2s 約合 16.92秒一張圖

【TRT SDXL模型】微星GeForce RTX 4070 SUPER 12G 魔龍姬 運算時間 1m47.1s 約合 10.71秒一張圖

在更復雜的模型中,TensorRT引擎的優勢愈發明顯,單張圖片的出圖速度能夠提高6秒左右。並且顯存利用達到了100%,跑滿12GB顯存。

生成式AI在2023年初露端倪,2024年將迎來徹底爆發,雖然幫助最大的依然是內容創作者,但對於普通用戶來說,他也可以讓沒有繪畫功底的人,獨立創作出一幅不亞於藝術家的作品,讓每個人都成爲自己生活中的藝術家。

9  RTX 視頻超分辨率(RTX Video Super Resolution)測試

目前RTX 視頻超分辨率(RTX Video Super Resolution)已經在部分瀏覽器中進行測試,首先玩家需要更新到NVIDIA最新驅動,在NVIDIA控制面板中的【調整視頻圖像設置】可以看到最新的RTX 視頻增強超分辨率。

RTX 視頻超分辨率是 AI 圖像處理的突破,它超越了傳統的邊緣檢測和特徵銳化技術,極大地提升直播視頻內容的質量。

开啓RTX 視頻超分辨率不僅需要最新版驅動,還需要使用RTX 40或30系列GPU,並且幾乎適用於Google Chrome和Microsoft Edge瀏覽器中的所有視頻內容(瀏覽器也需要更新到最新版本)。

开啓後,目前已知的打开YouTube或者B站,都可以享受到RTX VSR效果的加成。

如果不確定,在全屏播放視頻時,可以打开任務管理器,看到GPU負載增加,即爲开啓成功。

我們打开YouTube隨意觀看視頻,在打开RTX VSR後,可以清晰明顯的看到水下珊瑚的質量明顯提高,邊緣更爲清晰,並且極大減少了失真現象。


 

(點擊放大查看原圖)

在下面這幅圖的對比中,可以明顯看到开啓RTX 視頻超分辨率後,胡須明顯更順滑,已經看不出馬賽克。

不過需要注意的是,RTX 視頻超分辨率在低分辨率下效果會更明顯,如果本身觀看的視頻爲1080p或2K以上,則基本很難看出區別。

這對於一些網速不夠快,只能看低分辨率視頻的用戶,或者視頻片源本身不夠清晰的情況,幫助非常大。

10 溫度及功耗測試

功耗測試中,我們選擇FurMark軟件進行拷機測試,並採用GPU-Z檢測溫度,功耗僅計算顯卡自身。

可以看到微星GeForce RTX 4070 SUPER 12G 魔龍姬這張顯卡但通過20分鐘左右的拷機測試,溫度在68℃左右,熱點溫度在78℃左右,顯存溫度爲62℃。

遊戲動態功耗測試

本次我們在拷機測試中最大板載功耗爲245W左右。不過由於不同遊戲負載不同,GPU的實際功耗是動態變化的,類似於FPS隨時間的變化,RTX 40系列很難觸及功耗牆。

微星GeForce RTX 4070 SUPER 12G 魔龍姬 3A遊戲平均功耗


RTX 3070 Ti 3A遊戲平均功耗

在實際的遊戲功耗測試中,我們選擇《光明記憶:無限》自帶benchmark,光追最高、DLSS質量、2K分辨率,來拉滿顯卡的性能極限,檢測我們實際應用場景的功耗。

可以看到微星GeForce RTX 4070 SUPER 12G 魔龍姬平均功耗爲223W,而RTX 3070 Ti甚至達到了288W低了65W

遊戲平均220W的功耗,對於長時間使用電腦的用戶來說,確實能夠有效降低電費,尤其是在南方,這種電費奇高的地區。同時對比上一代同級別產品有大幅下降,可以說RTX 40系顯卡擁有更低功耗和更高的性能。

11 魔龍姬定制背板 玩法多

通篇測試下來,相信大家已經對微星GeForce RTX 4070 SUPER 12G 魔龍姬性能有了大概的掌握。可以說本次SUPER系列依然是加量不加價,這一點與RTX 20系非常相似。

從產品定位來說,RTX 4070 SUPER在性能上幾乎與RTX 4070 Ti持平,可以說這次SUPER系列的推出,將RTX 40系中高端顯卡完全提升了一個等級。

綜合性能方面,公版RTX 4070 SUPER相比RTX 4070提升在15-20%左右,與RTX 4070 Ti的差距在5%左右。而微星GeForce RTX 4070 SUPER 12G 魔龍姬作爲OC版顯卡,進一步將這一差距縮小到了3%左右。

雖然RTX 4070 SUPER它定位2K分辨率的高幀光追遊戲,但不管是日常網遊、獨立遊戲,或是傳統3A遊戲,在4K分辨率下都能夠達到流暢甚至電競級水准。

以目前RTX 40系發布的這些顯卡來說,RTX 4070 SUPER是堪稱完美平衡的一款顯卡,不僅在3A遊戲玩家中,又多了一個2K高性能遊戲體驗的顯卡,對於內容創作,RTX 4070 SUPER也同樣得心應手。

它搭配了12GB顯存,擁有568 TOPS AI算力,尤其在搭配了TensroRT插件後,SDXL這種大模型的單張圖片,較原先生成速度快了38%左右。而且生成圖片也只是AIGC的基礎玩法,隨着OpenAI發布的Sora大模型逐漸成熟應用,相信中高端顯卡仍會再次成爲搶手貨。

本次測試的微星GeForce RTX 4070 SUPER 12G 魔龍姬雖然不是該系列顯卡的首秀,但魔龍姬作爲可替換背板出現還是首次,相信微星也正在摸索該系列的各種玩法。目前這張顯卡在微星旗艦店有售,感興趣玩家不妨前去了解一下。



標題:微星RTX 4070 SUPER 12G 魔龍姬顯卡評測 定制背板玩法多

地址:https://www.utechfun.com/post/341813.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡