截止目前,NVIDIA已經發布了6張RTX 40系顯卡,今日解禁的RTX 4060也讓40系顯卡在1080p、2K和4K分辨率下,都有不同價位的產品供用戶選擇。今天測試的顯卡爲COLORFIRE GeForce RTX 4060 暗影紫 8GB。
RTX 4060的發布,也終於讓40系顯卡的價格來到了3000元以下,對於裝機預算5000元的用戶來說,又多了一個不錯的選擇。
從Steam硬件調查榜可以看到,玩家所用顯卡位列前五名的,分別是GTX 1650、GTX 1060、RTX 3060、RTX 2060,以及RTX 3060 Laptop。所以60級別產品受歡迎程度可想而知,在兼顧了價格實惠的同時,又能享受到新一代產品的技術。
在遊戲分辨率的調查中顯示,1080p分辨率仍以64.33%的絕對優勢牢牢佔據第一的位置。
想必關注昨天首測的用戶已經知道,這張RTX 4060顯卡在實際使用時的功耗甚至不到100W,讓人夢回GTX 1060的時代,而性能提升相較上一代RTX 3060還是非常大的。
1 COLORFIRE GeForce RTX 4060 暗影紫 8GB 顯卡概覽
COLORFIRE GeForce RTX 4060 暗影紫 8GB顯卡的外包裝相當俏皮可愛,相較此前發布的橘影橙,這款顯卡的IP是一只名爲疾風的英短藍貓。
疾風小貓的背景設定爲喵星忍隊精英,所以包裝上我能還能看到弓箭、手裏劍以及鉤鎖等元素。
COLORFIRE GeForce RTX 4060 暗影紫 8GB整卡尺寸爲249×136×41.9mm(含擋板),佔用2槽空間。
這張暗影紫貓卡屬於COLORFIRE MEOW系列顯卡,外甲整體的深灰色非常還原英短配色,風扇點綴的紫色也更加貼合忍者喵的設定,即便玩家沒有養寵物,也能夠通過MEOW系列的硬件產品獲得“吸貓”般的樂趣。
COLORFIRE GeForce RTX 4060 暗影紫 8GB顯卡採用90mm雙11葉風扇設計,風扇中央爲IP疾風頭像。導流罩上還有類似於貓抓板的紋理設計。
在內部散熱上,COLORFIRE GeForce RTX 4060 暗影紫 8GB採用2根6mm熱管,整體爲大面積鋁擠+鍍鎳熱管。
另外芯片功耗下降,發熱量減小,這張顯卡背板沒有對核心進行鏤空處理,看起來整體性更強。
COLORFIRE GeForce RTX 4060 暗影紫 8GB顯卡側面可以看到單8pin供電接口,這張顯卡TDP僅有115W,不過NVIDIA官方推薦的電源依然爲550W。這種情況一般爲整機內配件都是旗艦的情況下,如果玩家目前的處理器爲上一代或者較爲入門的型號,可以適當降低電源。
不過如果是新裝機的用戶,電源最好還是直接上550W或更高,能夠爲後續硬件擴展留下充足余地。
視頻輸出接口上,採用了HDMI 2.1 + DP 1.4a*3的四接口設計。HDMI 2.1可支持4K 120Hz HDR、8K 60Hz HDR。雖然接口依然支持高規格,但放在這張卡上其實有點奢侈了。
2 NVIDIA GeForce RTX 4060架構淺析
本次發布的GeForce RTX 40系顯卡由全新的NVIDIA Ada Lovelace架構打造,採用TSMC 4N NVIDIA定制工藝,旗艦核心AD102達到了的760億個晶體管,而在RTX 30系顯卡中爲280億個。
與上一代NVIDIA Ampere相比,NVIDIA Ada Lovelace在相同功率下,具有2倍以上的性能提升,最高可達到90-TFLOPS的着色器數據吞吐量。
本次發布的RTX 4060共有3072個CUDA核心,提供了15-TFLOPS算力;24個第三代Ada RT Core擁有35 RT-TFLOPS;96個第四代Tensor Core可提供242 Tensor-TFLOPS。
另外在本次的規格說明上,NVIDIA官方也特別表明了L2 Cache容量以及最終的等效帶寬,這是RTX 40在架構中變化比較大的地方,同時也是玩家對位寬減小有爭議的“罪魁禍首”。
我們以兩張圖來簡單說明L2緩存的作用。
如果把GPU內核比作網店店主,那么L1緩存就是在日常工作的屋子中堆放的可發貨產品,但由於所有工作都要在這間屋子進行,堆放產品的空間有限;所以大部分產品就需要到L2緩存中,它就好比在工作室隔壁的倉庫,雖然需要走出去,但仍然是很近的路程。
如果這個倉庫還是放不下,那么只能到更遠的顯存中去調取產品。當然如果有爆顯存的情況,那么這位“店主”可能還要打車去更遠的系統內存區調取數據。
這中間的路程和耗費時間就好比GPU額外的工作量,如果絕大部分數據只存放在L2緩存就可以拿到,那么將極大節省功耗。並且由於不再需要頻繁調取顯存中的數據,所以顯存位寬適當降低,對於運行效率也是沒有影響的。
在真正的GPU中,內核是所有計算發生的地方,而這就是L1數據緩存的作用所在。每個SM都有一個超低延遲的L1數據緩存,緊挨其處理內核,使L1成爲GPU尋找信息的首選。
然而,由於L1緩存需要離內核非常近,不可能非常大。
如果在L1緩存中找不到內核計算所需的數據,GPU將在L2數據緩存中尋找。這個顯存系統位於GPU芯片上,並通過一個非常高速的橫梁系統連接到所有的GPC(圖形處理集群),每個GPC包括多個SM。如果在L2緩存中找到了信息,那么GPU就挑出這些數據並將其放入內核。
如果在L2緩存中找不到信息(被稱爲緩存缺失),那么GPU將通過顯存接口在VRAM中尋找。這在整個GPU存儲子系統中產生了很多額外的工作量,並降低了性能和功耗效率。
完整的AD102核心
完整的AD106核心
RTX 4060使用的AD107核心
本次RTX 4060罕見地使用了AD107芯片,與RTX 4060 Ti並不相同。採用了3組GPC,平分16組TPC,並且NVENC單元變爲2個。
這張RTX 4060的L2緩存爲24MB,而上一代RTX 3060爲3MB;與RTX 4060 Ti和RTX 3060 Ti相同,都達到了8倍的差距。
增加L2緩存的大小可以提高性能,降低延遲,並提高續航時長,數據訪問在GPU上即可完成(否則GPU就要頻繁從顯存讀取數據,過分依賴顯存帶寬)。所以,這也是爲什么在RTX 40系顯卡中,位寬帶寬普遍偏小的原因。
3 測試平台簡介
GPU-Z在2.54版本的更新中,已經能夠識別RTX 4060 Ti和RTX 4060的信息。
RTX 4060採用AD107核心,擁有3072個CUDA,Boost頻率爲2460MHz,RTX 3060則爲1777MHz,提升非常大。
採用8GB GDDR6顯存,位寬爲128bit,顯存帶寬272 GB/s(最終等效帶寬453 GB/s),光柵單元和紋理單元爲48和96。
這裏注意一下,RTX 4060與RTX 4060 Ti的光柵單元都是48個,所以在性能提升上,RTX 4060相較RTX 3060還是相當大的。
4 理論性能測試
下面先進行的是用來衡量顯卡DX11理論性能的3DMARKFS套裝:FS,FSE,FSU三者分別對應顯卡在1080P、2K、4K的理論性能,取顯卡分數實際測試結果如下:
在FS套裝測試中,COLORFIRE GeForce RTX 4060 暗影紫 8GB顯卡相比RTX 3060,其中FS提升29%;FSE提升24%;FUS提升14%,綜合提升22%。對比剛剛發布的RTX 4060 Ti,綜合成績相差21%左右。
而在針對DX12環境下的Time Spy和Time Spy Extreme測試中,COLORFIRE GeForce RTX 4060 暗影紫 8GB顯卡相較RTX 3060的提升分別爲:TS提升20%;TSE提升20%,綜合約爲20%。對比RTX 4060 Ti,綜合成績相差22%左右。
PortRoyal是3DMARK中專門針對光追性能的測試項,COLORFIRE GeForce RTX 4060 暗影紫 8GB顯卡相較RTX 3060的提升約爲17%。對比RTX 4060 Ti,相差26%左右。
綜合來看,COLORFIRE GeForce RTX 4060 暗影紫 8GB顯卡的傳統理論性能相較RTX 3060的提升約爲20%。
下面我們再來看看3DMARK中新增的一些具體應用場景的測試。
Speed Way測試是3DMARK最新更新的用於測試DirectX12 Ultimate 性能的顯卡基准測試。要運行此測試,顯卡必須支持 DirectX 12 Ultimate 並包含 6GB 及以上顯存。
這項測試結合了實時光线追蹤和傳統渲染技術來測量顯卡性能。場景含有光线追蹤反射、實時全局光照、網格着色器、體積照明、粒子和後處理效果。所以SW的測試基本可以看做次世代3A遊戲基准。
COLORFIRE GeForce RTX 4060 暗影紫 8GB顯卡對比RTX 3060,從1080p分辨率到4K提升依次爲:16%/16%/15%。
另外我們使用3DMARK剛剛更新的DLSS 3進行了相關性能測試。不過由於RTX 3060無法开啓,這裏使用DLSS2進行對比測試。
在2K分辨率下,COLORFIRE GeForce RTX 4060 暗影紫 8GB顯卡DLSS开關相比RTX 3060的提升爲31%/17%;4K分辨率由於關閉情況下顯卡幾乎無法正常運行,僅看开啓狀態,提升約爲58%。
5 常規遊戲 性能測試
(在遊戲測試中,如有提幀技術,NVIDIA均开啓DLSS質量模式。)
由於本次RTX 40系加入了DLSS 3新技術,所以後面會進行單獨測試,這裏依然選擇主流的幾款3A大作進行遊戲性能對比。
在《極限競速:地平线5》中,測試成績非常有意思,我們細分析來看。
其中COLORFIRE GeForce RTX 4060 暗影紫 8GB顯卡相比RTX 3060在1080p分辨率下提升明顯,達到33%;而在2K分辨率下提升爲17%,4K分辨率下則被RTX 3060反超,雖然只有1幀,但也說明大顯存在高分辨率下的優勢相當明顯。
另外1080p分辨率中,RTX 4060與RTX 4060 Ti的分數相差不大,這是因爲該分辨率下主要瓶頸在於CPU。
在《刺客信條:英靈殿》中,COLORFIRE GeForce RTX 4060 暗影紫 8GB顯卡相比RTX 3060的提升分別爲:1080p提升23%;2K提升17%;4K提升11%,綜合提升17%。
在《無主之地3》中,COLORFIRE GeForce RTX 4060 暗影紫 8GB顯卡相比RTX 3060的提升分別爲:1080p提升22%;2K提升20%;4K分辨率相差2幀。
《光明記憶:無限》的光追測試軟件是獨立於遊戲的測試工具,比遊戲中用到的光线追蹤技術更多,測試條件爲“RTX最高/DLSS質量”。
性能方面,COLORFIRE GeForce RTX 4060 暗影紫 8GB顯卡相比RTX 3060的提升分別爲:1080p提升33%;2K提升20%;4K提升6%,綜合提升20%。
在另外一款國產遊戲《邊境》的跑分軟件中,情況基本與《光明記憶:無限》相同,測試條件均在“RTX最高/DLSS質量”下進行。
在《邊境》中,COLORFIRE GeForce RTX 4060 暗影紫 8GB顯卡相比RTX 3060的提升分別爲:1080p提升37%;2K提升24%;4K提升29%,綜合提升30%。
暴雪剛剛發布的遊戲《暗黑破壞神4》已經集成了DLSS 3,不過能夠明顯看到,在DLSS 3开啓的情況下幀率下降。目前這種反常的表現尚不清楚原因,但大概率是遊戲優化存在問題,我們也將持續關注暗黑4的後期動向。
但是在1080p分辨率下,COLORFIRE GeForce RTX 4060 暗影紫 8GB开啓DLSS 3已經能夠達到200幀以上的極致體驗。
最後的測試中本該測一下“跑分軟件”《賽博朋克2077》的,不過最近遊戲更新幾次後,崩潰問題愈發明顯,到現在已經完全無法進遊戲。所以我們只能看看早先的截圖,體會一下不同的光影模式。
從上至下依次爲超級畫質/光追超級/光追過載。可以看到光追過載相比光追超級更貼近於真實效果。它模擬了真實的光线路徑,其實相比之前的光线追蹤模擬了更多光线在不同表面的反射,完整的計算出了場景的真實光照,避免了上一代光追中出現“死黑”的情況。
這也是NVIDIA致力於打造的下一代光追場景,但是截止目前它對硬件計算的需求太過龐大,即便是旗艦顯卡,也無法在4K分辨率下流暢運行。
6 DLSS 3性能測試
截止目前,已有超過300款遊戲和應用支持DLSS,其中已有38款遊戲和應用支持最新的DLSS 3。
包括《逆水寒》、《微軟模擬飛行》、《毀滅全人類2:重新探測》、《瘟疫傳說:安魂曲》、《光明記憶:無限》、《暗影火炬城》、《F1 22》、《生死輪回》、《漫威蜘蛛俠:重制版》、《超級人類》、《極限競速:地平线5》、《賽博朋克2077》、《紅霞島》、《暗黑破壞神IV》、《侏羅紀世界:進化2》等等。
本次DLSS 3的測試圖表比較繁瑣,並且增加了1% Low FPS和延遲的測試,1% Low FPS則是將一段時間內的幀數從大到小排列,取最小的1%出來,再對這1%的數求平均值。
在坐標軸左側的爲延遲(越低越好),坐標軸右側的均爲幀數(越高越好),並且由於牽扯到正負坐標,所以兩側的值有可能會不同。
在《侏羅紀世界:進化2》中,DLSS 3的表現非常亮眼,由於此類模擬經營遊戲的特點就是同屏單位多,更加佔用CPU資源,而DLSS 3能夠進行幀生成,來突破CPU瓶頸限制。
不過幀生成並不是毫無弊端,這也是爲什么此次測試加入了延遲。並且在开啓DLSS 3後,NVIDIA Reflex是捆綁开啓的。
在《巫師3》光线追蹤的測試中,由於沒有benchmark,我們選擇畫面元素較多的固定場景截取幀數,故1% Low幀數較高。
COLORFIRE GeForce RTX 4060 暗影紫 8GB顯卡即便在DLSS 2开啓的情況下也只有49幀,但开啓DLSS 3後,能夠達到80幀的流暢水准,並且延遲相較關閉DLSS有大幅提升。
《極限競速:地平线5》是最新加入DLSS 3的遊戲,在开啓DLSS 2後有6幀左右的提升,在开啓DLSS 3後總共有10幀左右提升。但這個成績有些存疑,按說CPU瓶頸遊戲在开啓DLSS 2後提升不明顯是正常的,但开啓DLSS 3後應該有質的飛躍。
《暗影火炬城》在开啓光追後對於性能要求明顯提高。其中DLSS 3相比DLSS關的幀數提升了61%,DLSS 2的提升則達到了42%。
7 AV1編碼測試
本次AV1編碼測試選擇了剪映專業版,它可以輸出H.264/HEVC/AV1三種編碼格式的視頻。
剪映專業版目前自帶AV1編碼輸出,在實際測試中,我們導出一段1分鐘左右的視頻。可以看到兩個文件容量相差103MB。
由於AV1編碼特性,生成文件的比特率更低,但視頻清晰度則完全相同。所以如果生成同比特率,同容量的文件,AV1將會更清晰。
我們通過NVIDIA ICAT來進行兩段視頻的畫面對比,圖中左側爲H.264編碼,右側爲AV1編碼。在100%的細節對比中,幾乎看不出任何區別。
8 D5渲染測試
D5是一款國內實時光线追蹤渲染器,支持多種建模軟件直讀,包括SketchUp、3Ds MAX、Rhino、Revit、Archicad、Blender、C4D等。目前也已經支持DLSS 3,下面我們分別看看幀數和功耗的情況。
選擇軟件自帶的默認場景【簡約客廳】
在實時幀數表現上,由於D5採用實時GPU渲染,所以壓力全在顯卡。可以看到在DLSS關和DLSS 2的情況下兩款顯卡差別不大,但是採用DLSS 3幀生成後,COLORFIRE GeForce RTX 4060 暗影紫 8GB顯卡一舉達到69幀。對於不要求高幀率的渲染軟件來說,能夠流暢轉動視角就夠了。
功耗方面,COLORFIRE GeForce RTX 4060 暗影紫 8GB顯卡的TDP爲115W;RTX 3060的TDP爲170W。關閉DLSS的情況下,兩張顯卡幾乎都處於滿載狀態。
DLSS 2开啓後能夠緩解一部分壓力,DLSS 3則能夠讓RTX 4060僅用60W流暢運行軟件。
9 RTX VSR(RTX Video Super Resolution)測試
目前RTX VSR(RTX Video Super Resolution)已經在部分瀏覽器中進行測試,首先玩家需要更新到NVIDIA最新驅動,在NVIDIA控制面板中的【調整視頻圖像設置】可以看到最新的RTX 視頻增強超分辨率。
RTX VSR是 AI 圖像處理的突破,它超越了傳統的邊緣檢測和特徵銳化技術,極大地提升直播視頻內容的質量。
开啓RTX VSR不僅需要最新版驅動,還需要使用RTX 40或30系列GPU,並且幾乎適用於Google Chrome和Microsoft Edge瀏覽器中的所有視頻內容(瀏覽器也需要更新到最新版本)。
开啓後,目前已知的打开YouTube或者B站,都可以享受到RTX VSR效果的加成。
如果不確定,在全屏播放視頻時,可以打开任務管理器,看到GPU負載增加,即爲开啓成功。
(點擊放大查看原圖)
我們打开YouTube隨意觀看視頻,在打开RTX VSR後,可以清晰明顯的看到水下珊瑚的質量明顯提高,邊緣更爲清晰,並且極大減少了失真現象。
10 溫度及功耗測試
功耗測試中,我們選擇FurMark軟件進行拷機測試,並採用GPU-Z檢測溫度,功耗僅計算顯卡自身。
COLORFIRE GeForce RTX 4060 暗影紫 8GB顯卡通過1小時左右的拷機測試,溫度一直控制在63℃左右,熱點溫度在75℃左右。
遊戲動態功耗測試
本次我們在拷機測試中最大板載功耗爲115W左右。但在實際遊戲測試中要低很多。
由於不同遊戲負載不同,GPU的實際功耗是動態變化的,類似於FPS隨時間的變化,RTX 40系列很難觸及功耗牆。
COLORFIRE GeForce RTX 4060 暗影紫 8GB顯卡 3A遊戲平均功耗
RTX 3060 3A遊戲平均功耗
在實際的遊戲功耗測試中,我們選擇《刺客信條:英靈殿》自帶benchmark,畫面設置最高、2K分辨率,來拉滿兩張顯卡的性能極限,檢測我們實際應用場景的功耗。
可以看到兩款顯卡雖然均爲60級別,但剛剛發布的RTX 4060平均功耗只有98W,而RTX 3060則是158W,低了60W,這的確是一個驚人的成績。
11 功耗不足100W!小貓咪大能量
截止目前,NVIDIA已經發布了6張RTX 40系顯卡,今日解禁的RTX 4060也讓40系顯卡在1080p、2K和4K分辨率下,都有不同價位的產品供用戶選擇。
兩張60級別顯卡分別定位:RTX 4060 Ti光追遊戲1080p百幀;RTX 4060光追遊戲1080p流暢,如果恰逢有DLSS 3的遊戲,也能達到百幀左右。
如果說RTX 4060 Ti仍有一定程度拔高的話,那么這張RTX 4060更大的意義在於迭代60級別顯卡,保障主流玩家出色的1080p分辨率體驗。
從性能上來說,RTX 4060採用了與RTX 4060 Ti相同的48個光柵單元,所以相較RTX 3060的綜合提升在20%左右,而RTX 4060 Ti相比RTX 3060 Ti的綜合提升在12%左右,這張RTX 4060算是誠意滿滿。
至於顯存,RTX 4060再次回到了標准的8GB,享受過RTX 3060的12GB大顯存,確實讓人非常難受。
雖然在遊戲方面,1080p分辨率下無所謂顯存大小,但在2K分辨率略顯疲態,甚至部分遊戲讓RTX 3060憑借顯存實現反超。不過對於打算購买60級別顯卡的玩家,大概率還是會配備1080p分辨率的顯示器。
真正難受的則是很多入門的內容創作者,日常處理一些簡單的後期工作,12GB大顯存用處還是非常大的。畢竟像D5這種很快集成DLSS 3的應用並不多,大量軟件在實時預覽時仍是靠顯存支撐。
除了性能提升顯著,這張RTX 4060也是首張實際使用功耗在100W以下的RTX 40系顯卡。基本是回到7年前,GTX 1060的級別了。
想想我自用的RTX 3080 Ti顯卡,滿載打遊戲,整機功耗瞬間400W以上。在南方電費較貴的地區,長時間可是一筆不小的开支。
COLORFIRE目前推出了兩個貓貓系列新顯卡,這張COLORFIRE GeForce RTX 4060 暗影紫 8GB顯卡的IP設計以英短藍貓爲原型,與橘影橙的橘貓正相反,一個比較適合白色機箱,一個更適配黑色機箱。
雖然市面上現在有各種娘、各種姬的擬人化顯卡,但寵物系列仍是空缺。如果你是資深貓奴,或者看慣了千篇一律的炫酷科技風,那么COLORFIRE的貓貓顯卡是不錯的選擇。
COLORFIRE GeForce RTX 4060 暗影紫 8GB首發價格2599元。相比上一代RTX 3060 12G,綜合提升達到20%,並且功耗下降了60%,對於5000元預算裝機的用戶,它稱得上一張很好的60級別迭代產品。
至於現在打算买RTX 3060顯卡的玩家,盡管目前很多第三方已經跌破2000元,但別忘了那場幾乎顛覆行業的“礦潮”,所帶來的後續影響。
標題:COLORFIRE RTX 4060貓卡首測 功耗降60%性能升20%
地址:https://www.utechfun.com/post/231783.html