本次RTX 40 SUPER系列一共發布了3張顯卡,其中RTX 4070 Ti SUPER最爲特殊,它首次採用了雙後綴,讓Ti和SUPER同時在一張顯卡中出現,不過在如此“強力”的加持下,它的性能也相當驚豔。今天帶來的是影馳GeForce RTX 4070 Ti SUPER 金屬大師的顯卡評測。
本次的SUPER作爲升級系列,性能相較原型卡有較大提升,但令人意外的是其中70 SUPER和70 Ti SUPER價格維持不變,而80 SUPER更是直降1400元。不過即便經過降價80級產品的價格也在8000元以上,接近9000元,是絕大部分玩家無法承受的。而RTX 4070 Ti SUPER則很好地兼顧到了價格與性能。
雖然這張RTX 4070 Ti SUPER屬於70級別,但其實力不容小覷,在2K分辨率下能夠達到光追遊戲百幀的體驗,甚至傳統3A遊戲中4K分辨率下也能夠達到流暢效果。
另外我們本次測試的金屬大師爲MSRP版,所有參數均與NVIDIA官方數據相同,也更能體現出該顯卡的性能表現。
下面先來看看影馳GeForce RTX 4070 Ti SUPER 金屬大師整體外觀。
1 影馳GeForce RTX 4070 Ti SUPER 金屬大師 概覽
影馳GeForce RTX 4070 Ti SUPER 金屬大師在RTX 40系中依舊沿襲了之前的設計風格,在包裝上也比較與衆不同。整體背景採用銀灰色爲主基調,正面印有金屬大師的系列logo,左下角則印有“METALTOP”的系列名稱。
影馳GeForce RTX 4070 Ti SUPER 金屬大師整卡的尺寸爲311×125×60mm(不含擋板),佔用3槽空間。
這張顯卡採用一體式金屬導流罩,造型方正。上面的幾何圖案均向中央匯集,整體來看頗有一種金屬魔方的感覺。
散熱方面,影馳GeForce RTX 4070 Ti SUPER 金屬大師採用3個102mm超大直徑的靜霜風扇,扇葉採用折角設計,爲散熱模塊提供了更強力和更大的風量,並支持智能啓停,提供零噪音的使用體驗。
再來看一下背板,影馳GeForce RTX 4070 Ti SUPER 金屬大師採用一體式金屬背板,同樣是銀灰色質感,從右側鏤空的進氣格柵能看到大量散熱鰭片以及熱管,而這張顯卡同樣採用了較短的PCB板。
內部散熱上,則採用鍍鎳銅底,搭配8根6mm復合式熱管,以及大面積金屬鰭片,提供更高的導熱效率。
從側面也可以看到,影馳GeForce RTX 4070 Ti SUPER 金屬大師整體的外甲一直從導流罩延伸至背板,讓整個顯卡的一體性更強。
視頻輸出接口上,影馳GeForce RTX 4070 Ti SUPER 金屬大師整採用了HDMI 2.1 + DP 1.4a*3的四接口設計。HDMI 2.1可支持4K 120Hz HDR、8K 60Hz HDR。從側面也能夠看到,這張顯卡將佔用三槽空間,所以想升級的用戶還要注意自己機箱內的環境。
本次影馳GeForce RTX 4070 Ti SUPER 金屬大師整整卡功耗爲285W,採用單16pin的輔助供電,建議電源爲750W及以上。
2 NVIDIA GeForce RTX 4070 Ti SUPER 架構淺析
本次發布的GeForce RTX 40系顯卡由全新的NVIDIA Ada Lovelace架構打造,採用TSMC 4N NVIDIA定制工藝,旗艦核心AD102達到了的760億個晶體管,而在RTX 30系顯卡中爲280億個。
與上一代NVIDIA Ampere相比,NVIDIA Ada Lovelace在相同功率下,具有2倍以上的性能提升,最高可達到90-TFLOPS的着色器數據吞吐量。
本次發布的RTX 4070 Ti SUPER共有8448個CUDA核心,提供了44-TFLOPS算力;66個第三代Ada RT Core擁有102 RT-TFLOPS;264個第四代Tensor Core可提供706 Tensor-TFLOPS(AI TOPS)。
RTX 4070 Ti SUPER的L2 Cache容量爲48MB,帶寬爲672 GB/s。NVIDIA官方也特別表明了L2 Cache的重要性,我們以兩張圖來簡單說明L2緩存的作用。
在真正的GPU中,內核是所有計算發生的地方,而這就是L1數據緩存的作用所在。每個SM都有一個超低延遲的L1數據緩存,緊挨其處理內核,使L1成爲GPU尋找信息的首選。然而由於L1緩存需要離內核非常近,不可能非常大。
如果在L1緩存中找不到內核計算所需的數據,GPU將在L2數據緩存中尋找。這個顯存系統位於GPU芯片上,並通過一個非常高速的橫梁系統連接到所有的GPC(圖形處理集群),每個GPC包括多個SM。如果在L2緩存中找到了信息,那么GPU就挑出這些數據並將其放入內核。
如果在L2緩存中找不到信息(被稱爲緩存缺失),那么GPU將通過顯存接口在VRAM中尋找。這在整個GPU存儲子系統中產生了很多額外的工作量,並降低了性能和功耗效率。
更多詳細的參數,我們爲大家總結出了一張表格,可以看到從各方面的規格來說,這張RTX 4070 Ti SUPER更接近於RTX 4070 Ti,距離RTX 4080還有一定差距,不過相比RTX 4070 Ti提升多少,還要看我們後面實測的結果。
另外最主要的價格方面,這張RTX 4070 Ti SUPER與RTX 4070 Ti相同,都是6499元。依然是加量不加價,下面我們直接看測試成績。
3 測試平台簡介
首先介紹一下測試平台,爲了保障影馳GeForce RTX 4070 Ti SUPER 金屬大師的性能發揮,我們的平台採用了i9-13900K。
下面還是來看看本次評測的顯卡參數,目前最新的GPU-Z爲2.57版本,參數識別較爲詳細。
影馳GeForce RTX 4070 Ti SUPER 金屬大師擁有8448個CUDA,Boost頻率爲NVIDIA官方相同的2610MHz。
顯卡採用16GB GDDR6X顯存,位寬爲256bit,這裏值得注意的是,雖然RTX 4070 Ti SUPER整體規格更貼近RTX 4070 Ti,但位寬與RTX 4080相同,所以整體的帶寬也要更高。光柵單元和紋理單元爲96和264。
4 理論性能測試
本次測試的影馳GeForce RTX 4070 Ti SUPER 金屬大師主要對比它的上下型號,RTX 4080以及RTX 4070 Ti。
下面先進行的是用來衡量顯卡DX11理論性能的3DMARKFS套裝:FS,FSE,FSU三者分別對應顯卡在1080P、2K、4K的理論性能,取顯卡分數實際測試結果如下:
在FS測試中,影馳GeForce RTX 4070 Ti SUPER 金屬大師相比RTX 4070 Ti,其中FS提升10%;FSE提升11%;FUS提升9%,綜合提升10%。對比RTX 4080,綜合成績相差15%左右。
而在針對DX12環境下的Time Spy和Time Spy Extreme測試中,影馳GeForce RTX 4070 Ti SUPER 金屬大師相較RTX 4070 Ti的提升分別爲:TS提升11%;TSE提升14%,綜合約爲13%。對比RTX 4080,綜合成績相差13%左右。
PortRoyal是3DMARK中專門針對光追性能的測試項,影馳GeForce RTX 4070 Ti SUPER 金屬大師相較RTX 4070 Ti的提升約爲15%。對比RTX 4080,相差13%左右。
下面我們再來看看3DMARK中新增的一些具體應用場景的測試。
Speed Way這項測試結合了實時光线追蹤和傳統渲染技術來測量顯卡性能。場景含有光线追蹤反射、實時全局光照、網格着色器、體積照明、粒子和後處理效果。所以SW的測試基本可以看做次世代3A遊戲基准。
影馳GeForce RTX 4070 Ti SUPER 金屬大師對比RTX 4070 Ti,從1080p分辨率到4K提升依次爲:23%/22%/21%。由於RTX 4070 Ti並不適合8K分辨率下運行,所以8K成績僅供參考。
最後是DLSS 3的相關性能測試。這一項測試更偏向實際的遊戲幀數跑分,所以整體基數較小,影馳GeForce RTX 4070 Ti SUPER 金屬大師的綜合提升依然在15%左右。
從整體的理論測試成績來看,傳統的FS/TS/PR三項測試,影馳GeForce RTX 4070 Ti SUPER 金屬大師相比RTX 4070 Ti綜合提升約爲13%左右;相比RTX 4080的差距在14%左右。但在更接近於實際遊戲的SpeedWay測試中,提升成績均在20%以上,下面我們來看看實際遊戲中的表現。
5 常規遊戲 性能測試
由於本次RTX 40系加入了DLSS 3新技術,所以後面會進行單獨測試,這裏依然選擇主流的幾款3A大作進行遊戲性能對比。
首先我們測試了近期非常熱門的《幻獸帕魯》,這款遊戲自帶DLSS,所以N卡要更輕松一些。另外遊戲雖然採用了虛幻引擎制作,但目前EA階段遊戲內容整體還是比較糙的,所以對於顯卡的要求並沒有很高。
我們選擇最高畫質進行幀數實測,影馳GeForce RTX 4070 Ti SUPER 金屬大師即便在4K分辨率下都能達到百幀以上較高的幀率,不過此類模擬建造類遊戲,會隨着世界內容的增多逐漸變卡,所以以上測試成績僅供參考。
《幻獸帕魯》遊戲共有5個畫質檔位,其中最高和最低差距較大,主要區別在於光线渲染、抗鋸齒和植被,在材質和貼圖方面差別較小。
在《極限競速:地平线5》中,影馳GeForce RTX 4070 Ti SUPER 金屬大師相比RTX 4070 Ti提升較爲明顯,從1080p到4K分辨率分別提升10%/10%/13%。
在《刺客信條:幻景》中,影馳GeForce RTX 4070 Ti SUPER 金屬大師相比RTX 4070 Ti的提升分別爲:1080p提升8%;2K提升12%;4K提升20%,綜合提升13%。
在《無主之地3》中,影馳GeForce RTX 4070 Ti SUPER 金屬大師相比RTX 4070 Ti的提升分別爲:1080p提升15%;2K提升18%;4K分辨率提升18%,綜合提升17%。
《光明記憶:無限》的光追測試軟件是獨立於遊戲的測試工具,比遊戲中用到的光线追蹤技術更多,測試條件爲“RTX最高/DLSS質量”。
性能方面,影馳GeForce RTX 4070 Ti SUPER 金屬大師相比RTX 4070 Ti的提升分別爲:1080p提升13%;2K提升13%;4K提升17%,綜合提升14%。
在另外一款國產遊戲《邊境》的跑分軟件中,情況基本與《光明記憶:無限》相同,測試條件均在“RTX最高/DLSS質量”下進行。
在《邊境》中,影馳GeForce RTX 4070 Ti SUPER 金屬大師相比RTX 4070 Ti的提升分別爲:1080p提升12%;2K提升13%;4K提升13%,綜合提升13%。
在“遊戲測試標杆”的《賽博朋克2077》中,由於增加了最新的光追超速模式,成績比較多,我們分別對比不同模式下的幀數。
可以看到在4K分辨率下影馳GeForce RTX 4070 Ti SUPER 金屬大師即便是超級畫質模式,也僅能達到60幀的流暢水准,但光追超級模式與之相差的並不多,僅有11幀。而在2K分辨率下光追超級模式也能達到接近百幀的流暢水准。作爲一款以光影效果見長的次世代遊戲來說,着實難得。
不過該測試中並未开啓DLSS 3,後面將有更詳細的DLSS 3對比測試。
從上至下依次爲超級畫質/光追超級/光线追蹤:超速模式。可以看到光线追蹤:超速模式相比光追超級更貼近於真實效果。它模擬了真實的光线路徑,其實相比之前的光线追蹤模擬了更多光线在不同表面的反射,完整的計算出了場景的真實光照,避免了上一代光追中出現“死黑”的情況。
另外《賽博朋克2077》更新了DLSS 3.5,支持光线重建技術。在上面的測試圖中不難發現,光线重建能夠更加精准的計算出反射部分的效果,接近於亮面金屬表面的反射中,未开啓RTX能夠看出畫質明顯的區別,不再贅述。重點在於DLSS 3.5的开關效果,除了廣告牌上所顯示的內容更清晰外,放大後能夠看到遠處電线以及工業區建築的細節外觀。
6 DLSS 3性能測試
截止目前,超過500款遊戲和應用已支持 RTX 技術。
其中《龍之信條 2》、《灰區战爭》、《半條命 2》RTX 版、《地平线:西之絕境》、《層層恐懼》、《人中之龍7外傳:無名之龍》、《人中之龍8》、《納克園:最後的樂園》、《Pax Dei》、《星際礦工》和《王權與自由》均將支持 DLSS 3 技術,其中有些遊戲將在今年發布,有些遊戲則將在今年更新對 DLSS 3 的支持,爲配備 GeForce RTX 40 系列顯卡的遊戲玩家帶來前所未有的性能和更高的圖像質量。
本次DLSS 3增加了1% Low FPS和延遲的測試,1% Low FPS則是將一段時間內的幀數從大到小排列,取最小的1%出來,再對這1%的數求平均值。
本次我們分別對《賽博朋克2077》,在三檔畫質下進行了DLSS 3的幀數測試,所有檔位均开啓DLSS質量記錄幀數。
可以看到在2K分辨率下,被譽爲次世代技術的光追超速模式,开啓DLSS 3後能達到88幀的成績,完全達到高幀率的流暢標准。
另外DLSS 3技術主要針對於CPU瓶頸的遊戲,所以也能夠看到在越低的分辨率,幀數提升越大,其中光追超速的1080p分辨率能夠達到57%左右。
《星空》在1.8.86大版本更新後,加入了DLSS 3,整體來看效果非常好,即便在4K分辨率下也能夠達到97幀的流暢水准。
其中1080p分辨率下DLSS 3相比DLSS 2提升達到57%;2K分辨率提升52%;4K分辨率提升41%。
《地平线5》也是顯卡測試的老朋友了,其出色的優化讓很多入門級產品都能跑出較高的幀率。在影馳GeForce RTX 4070 Ti SUPER 金屬大師也有較明顯的體現。在3種分辨率中,开啓DLSS 3相比DLSS 2的提升分別爲39%/28%/10%。
最後我們也測試了《巫師3:狂獵》,這款遊戲在加入了光线追蹤後,對於配置的要求直线上升。
其中影馳GeForce RTX 4070 Ti SUPER 金屬大師在2K分辨率下,开啓DLSS 3相比關閉DLSS,提升達到了111%;相比DLSS 2的提升也達到了53%。另外在开啓DLSS 3後會強制开啓Reflex Boost,能夠大幅減少畫面延遲。
7 生產力工具測試
D5渲染器
D5是一款國內實時光线追蹤渲染器,支持多種建模軟件直讀,包括SketchUp、3Ds MAX、Rhino、Revit、Archicad、Blender、C4D等。目前也已經支持DLSS 3,下面我們分別看看幀數和功耗的情況。
選擇軟件自帶的默認場景【簡約客廳】
由於D5渲染器在預覽時的尺寸爲顯示器實際分辨率,所以這裏測試在4K分辨率下進行。
在實時幀數表現上,由於D5採用實時GPU渲染,所以壓力全在顯卡。可以看到在4K分辨率下,影馳GeForce RTX 4070 Ti SUPER 金屬大師也是PPT的狀態,僅有18幀。而开啓DLSS 3後,幀數提升可達到256%左右,非常暴力。
功耗方面,影馳GeForce RTX 4070 Ti SUPER 金屬大師的TDP爲285W。關閉DLSS的情況下,實際平均使用功耗爲246W,而在开啓DLSS 3後,功耗僅有212W。更低的功耗,更高的幀數,DLSS 3對於內容創作者來說,也是更必要的技術加持。
8 AIGC測試
AI時代不知何時已經離人們的生活越來越近,小到文本改寫,大到各種生成式AI。此前我們已經測試過Stable Diffusion的AI繪圖能力,不過目前NVIDIA推出了全新的TensorRT插件,可以充分調用Tensor算力,下面我們來測試一下影馳GeForce RTX 4070 Ti SUPER 金屬大師在這方面的性能表現。
【注:所有測試默認开啓xformers優化方案】
首先是較爲基礎的SD1.5模型測試,在SD1.5中模型的輸出分辨率爲512×512和768×768。我們將導出【TRT】引擎,並記錄使用默認模型渲染,以及【TRT】模型渲染的批次時間。
根據NVIDIA提供的統一參數進行輸出,以便記錄結果。其中採樣方式爲:Euler a;採樣步驟:50;Batch Count:10
【默認SD1.5模型】影馳GeForce RTX 4070 Ti SUPER 金屬大師 運算時間 35.2s 約合 3.52秒一張圖
【TRT SD1.5模型】影馳GeForce RTX 4070 Ti SUPER 金屬大師 運算時間 24.1s 約合 2.41秒一張圖
第二次測試爲的SDXL模型測試,SDXL模型將在1024×1024分辨率進行訓練,相比SD1.5來說圖像大了2倍,它可以提供更准確的關鍵字匹配,從而獲得更真實的結果。但由於更高的原生分辨率和模型復雜性,SDXL模型的計算強度明顯更高。
我們按照相同的參數進行設置,但尺寸規定爲1024×1024,下面看看影馳GeForce RTX 4070 Ti SUPER 金屬大師的表現如何。
【默認SDXL模型】影馳GeForce RTX 4070 Ti SUPER 金屬大師 運算時間 2m15.7s 約合 13.57秒一張圖
【TRT SDXL模型】影馳GeForce RTX 4070 Ti SUPER 金屬大師 運算時間 1m24.9s 約合 8.49秒一張圖
在更復雜的模型中,TensorRT引擎的優勢愈發明顯,單張圖片的出圖速度能夠提高6秒左右。
生成式AI在2023年初露端倪,2024年將迎來徹底爆發,雖然幫助最大的依然是內容創作者,但對於普通用戶來說,他也可以讓沒有繪畫功底的人,獨立創作出一幅不亞於藝術家的作品,讓每個人都成爲自己生活中的藝術家。
9 RTX 視頻超分辨率(RTX Video Super Resolution)測試
目前RTX 視頻超分辨率(RTX Video Super Resolution)已經在部分瀏覽器中進行測試,首先玩家需要更新到NVIDIA最新驅動,在NVIDIA控制面板中的【調整視頻圖像設置】可以看到最新的RTX 視頻增強超分辨率。
除了RTX視頻超分辨率,目前在NVIDIA控制面板中,還新增了HDR高動態範圍視頻的選項。想要开啓HDR效果首先需要顯示器自身支持HDR,在啓用顯示器HDR效果後,該選項會亮起。
勾選後用戶在上網瀏覽時,會直接觀看到優化後的視頻,並且它在窗口狀態下即可直接生效,相當於把普通SDR視頻直接轉換成了HDR視頻,有HDR顯示器的用戶不妨試試這一效果。
回到正題,RTX 視頻超分辨率是 AI 圖像處理的突破,它超越了傳統的邊緣檢測和特徵銳化技術,極大地提升直播視頻內容的質量。
开啓RTX 視頻超分辨率不僅需要最新版驅動,還需要使用RTX 40或30系列GPU,並且幾乎適用於Google Chrome和Microsoft Edge瀏覽器中的所有視頻內容(瀏覽器也需要更新到最新版本)。
开啓後,目前已知的打开YouTube或者B站,都可以享受到RTX VSR效果的加成。
如果不確定,在全屏播放視頻時,可以打开任務管理器,看到GPU負載增加,即爲开啓成功。
我們打开YouTube隨意觀看視頻,在打开RTX VSR後,可以清晰明顯的看到水下珊瑚的質量明顯提高,邊緣更爲清晰,並且極大減少了失真現象。
(點擊放大查看原圖)
在下面這幅圖的對比中,可以明顯看到开啓RTX 視頻超分辨率後,胡須明顯更順滑,已經看不出馬賽克。
不過需要注意的是,RTX 視頻超分辨率在低分辨率下效果會更明顯,如果本身觀看的視頻爲1080p或2K以上,則基本很難看出區別。
這對於一些網速不夠快,只能看低分辨率視頻的用戶,或者視頻片源本身不夠清晰的情況,幫助非常大。
10 溫度及功耗測試
功耗測試中,我們選擇FurMark軟件進行拷機測試,並採用GPU-Z檢測溫度,功耗僅計算顯卡自身。
可以看到影馳GeForce RTX 4070 Ti SUPER 金屬大師這張顯卡通過40分鐘左右的滿頻率拷機測試中,溫度在64℃左右,熱點溫度在76℃左右,顯存溫度62℃左右。
遊戲動態功耗測試
本次我們在拷機測試中,關掉8X MSAA最大板載功耗爲285W左右。不過由於不同遊戲負載不同,GPU的實際功耗是動態變化的,類似於FPS隨時間的變化,RTX 40系列很難觸及功耗牆。
影馳GeForce RTX 4070 Ti SUPER 金屬大師遊戲平均功耗
在實際的遊戲功耗測試中,我們選擇《光明記憶:無限》自帶benchmark,光追最高、DLSS質量、2K分辨率,來拉滿顯卡的性能極限,檢測我們實際應用場景的功耗。
可以看到影馳GeForce RTX 4070 Ti SUPER 金屬大師平均功耗爲275W,在實機測試中,基本達不到峰值功耗。
11 金屬魔方 硬核實力派
由於本次NVIDIA發布的RTX 40 SUPER系列顯卡只有RTX 4070 Ti SUPER沒有公版,所以此次測試也算補齊了三張MSRP顯卡的性能表現。
此前我們測試過RTX 4070 Ti SUPER的OC版顯卡,其性能介於RTX 4070 Ti與RTX 4080之間,但更接近RTX 4080。而通過此次影馳GeForce RTX 4070 Ti SUPER金屬大師MSRP版的測試,可以看到它基本位於兩張卡的正中間。
對於大部分大部分遊戲玩家來說,雖然80級產品被譽爲遊戲旗艦,但價格相比70級產品差距過大,非土豪所不能承受。
而這張RTX 4070 Ti SUPER從實測來看,3A遊戲2K高幀率沒有任何問題,倒不如說它更像是一張4K分辨率下能流暢體驗3A遊戲的顯卡。可以說這張RTX 4070 Ti SUPER已然有了80級別的水准。
而內容創作和AI方面,近期筆者也有一些AI相關的測試項目,12GB顯存在一些大模型下還是稍顯喫力,而RTX 4070 Ti SUPER的16GB顯存在各種場合下都顯得遊刃有余。並在搭配媲美80級顯卡的算力,出圖更快,可以勝任任何輕度創作。
除了型號,影馳GeForce RTX 4070 Ti SUPER金屬大師這張顯卡本身也有很多可圈可點的地方,金屬大師作爲影馳平價系列產品,雖然性能不是頂級的,但外觀設計理念和顏值一直在线。
金屬大師系列一直堅持“無光信仰”,同時全金屬包裹的卡身也有着極強的質感,可以說在同級別產品中,金屬大師系列絕對稱得上出類拔萃。
不過目前MSRP版的金屬大師已經無貨,影馳RTX 4070 Ti SUPER 金屬大師有OC版在旗艦店有售賣,相比MSRP版它的頻率更高,也擁有更強的性能,有興趣的不妨前去了解。
標題:影馳RTX 4070 Ti SUPER金屬大師評測 金屬魔方 硬核實力派
地址:https://www.utechfun.com/post/344563.html