NVIDIA GeForce RTX 4060首測不到100W搭載DLSS3的性能小鋼炮

2023-06-29 18:31:54 編輯： robot

導讀 RTX 40系入門級顯卡，RTX 4060終於與大家見面。隨着這張顯卡的發布，RTX 40系產品，按照目前已知的進度，從常規型號到Ti系列，全线布局完成。 60級別的產品一直是最受玩家歡迎的，從St...

RTX 40系入門級顯卡，RTX 4060終於與大家見面。隨着這張顯卡的發布，RTX 40系產品，按照目前已知的進度，從常規型號到Ti系列，全线布局完成。

60級別的產品一直是最受玩家歡迎的，從Steam硬件調查榜可以看到，位列前五名的分別是GTX 1650、GTX 1060、RTX 3060、RTX 2060，以及RTX 3060 Laptop。

而在遊戲分辨率的調查中顯示，1080p分辨率仍以64.33%的絕對優勢牢牢佔據第一的位置。這張RTX 4060顯卡的推出，可以把光追帶給更多1080p的主流玩家。

根據NVIDIA官方統計，RTX GPU剛推出時，只有37%的RTX20系列玩家啓用光线追蹤，26%的人啓用DLSS。而現在，83%的RTX40 系列遊戲玩家會選擇啓用光线追蹤，79%的人啓用DLSS。

隨着RTX技術日趨成熟，現在已有超過400個RTX加速的遊戲、應用，且絕大部分玩家都會選擇开啓RTX以獲得更好的體驗。

在RTX 40系中，顯卡位寬普遍減小，這也是用戶抱怨的問題之一。但本代架構中超大的L2緩存也幫助提高性能，降低延遲。在位寬小於上一代的情況下，顯卡最終等效帶寬實現反超，能耗比顯著提升。這也是爲什么此次RTX 40系顯卡即使是RTX 4070這樣的中端產品，也能將遊戲功耗控制在200W以內的主要原因。

本次MSRP版RTX 4060在6月28日晚21:00解禁，而各OC版顯卡則在6月29日晚21:00解禁，也請大家留意後續的評測。

1 NVIDIA GeForce RTX 4060架構淺析

本次發布的GeForce RTX 40系顯卡由全新的NVIDIA Ada Lovelace架構打造，採用TSMC 4N NVIDIA定制工藝，旗艦核心AD102達到了的760億個晶體管，而在RTX 30系顯卡中爲280億個。

與上一代NVIDIA Ampere相比，NVIDIA Ada Lovelace在相同功率下，具有2倍以上的性能提升，最高可達到90-TFLOPS的着色器數據吞吐量。

本次發布的RTX 4060共有3072個CUDA核心，提供了15-TFLOPS算力；24個第三代Ada RT Core擁有35 RT-TFLOPS；96個第四代Tensor Core可提供242 Tensor-TFLOPS。

另外在本次的規格說明上，NVIDIA官方也特別表明了L2 Cache容量以及最終的等效帶寬，這是RTX 40在架構中變化比較大的地方，同時也是玩家對位寬減小有爭議的“罪魁禍首”。

我們以兩張圖來簡單說明L2緩存的作用。

如果把GPU內核比作網店店主，那么L1緩存就是在日常工作的屋子中堆放的可發貨產品，但由於所有工作都要在這間屋子進行，堆放產品的空間有限；所以大部分產品就需要到L2緩存中，它就好比在工作室隔壁的倉庫，雖然需要走出去，但仍然是很近的路程。

如果這個倉庫還是放不下，那么只能到更遠的顯存中去調取產品。當然如果有爆顯存的情況，那么這位“店主”可能還要打車去更遠的系統內存區調取數據。

這中間的路程和耗費時間就好比GPU額外的工作量，如果絕大部分數據只存放在L2緩存就可以拿到，那么將極大節省功耗。並且由於不再需要頻繁調取顯存中的數據，所以顯存位寬適當降低，對於運行效率也是沒有影響的。

在真正的GPU中，內核是所有計算發生的地方，而這就是L1數據緩存的作用所在。每個SM都有一個超低延遲的L1數據緩存，緊挨其處理內核，使L1成爲GPU尋找信息的首選。

然而，由於L1緩存需要離內核非常近，不可能非常大。

如果在L1緩存中找不到內核計算所需的數據，GPU將在L2數據緩存中尋找。這個顯存系統位於GPU芯片上，並通過一個非常高速的橫梁系統連接到所有的GPC（圖形處理集群），每個GPC包括多個SM。如果在L2緩存中找到了信息，那么GPU就挑出這些數據並將其放入內核。

如果在L2緩存中找不到信息（被稱爲緩存缺失），那么GPU將通過顯存接口在VRAM中尋找。這在整個GPU存儲子系統中產生了很多額外的工作量，並降低了性能和功耗效率。

完整的AD102核心

完整的AD106核心

RTX 4060使用的AD107核心

本次RTX 4060罕見地使用了AD107芯片，與RTX 4060 Ti並不相同。採用了3組GPC，平分16組TPC，並且NVENC單元變爲2個。

這張RTX 4060的L2緩存爲24MB，而上一代RTX 3060爲3MB；與RTX 4060 Ti和RTX 3060 Ti相同，都達到了8倍的差距。增加L2緩存的大小可以提高性能，降低延遲，並提高續航時長，數據訪問在GPU上即可完成（否則GPU就要頻繁從顯存讀取數據，過分依賴顯存帶寬）。所以，這也是爲什么在RTX 40系顯卡中，位寬帶寬普遍偏小的原因。

2 測試平台簡介

由於此次RTX 4060沒有FE版顯卡，所以外觀方面我們直接略過，來看性能測試的成績。

首先介紹一下測試平台，爲了保障RTX 4060的性能發揮，我們的平台也進行了全面更新。

GPU-Z在2.54版本的更新中，已經能夠識別RTX 4060 Ti和RTX 4060的信息。

RTX 4060採用AD107核心，擁有3072個CUDA，Boost頻率爲2460MHz，RTX 3060則爲1777MHz，提升非常大。

採用8GB GDDR6顯存，位寬爲128bit，顯存帶寬272 GB/s（最終等效帶寬453 GB/s），光柵單元和紋理單元爲48和96。

3 理論性能測試

本次測試RTX 4060主要對比RTX 3060 12G，不過鑑於AMD剛剛發布了RX 7600，且價格爲2149元，相差不多。所以測試中部分對比項加入了RX 7600，大家也能看看這兩款本代入門級顯卡的表現如何。

下面先進行的是用來衡量顯卡DX11理論性能的3DMARKFS套裝：FS,FSE,FSU三者分別對應顯卡在1080P、2K、4K的理論性能，取顯卡分數實際測試結果如下：

在FS測試中，一直是AMD的強項。RTX 4060相比RTX 3060，其中FS提升29%；FSE提升25%；FUS提升13%，綜合提升22%。對比剛剛發布的RTX 4060 Ti，綜合成績相差21%左右。

而在與RX 7600的對比中，RTX 4060與之相差14%左右。

而在針對DX12環境下的Time Spy和Time Spy Extreme測試中，RTX 4060相較RTX 3060的提升分別爲：TS提升21%；TSE提升21%，綜合約爲21%。對比RTX 4060 Ti，綜合成績相差21%左右。

而在DX12的測試中，雖然RX 7600雖然依舊有些優勢，但幾乎已經持平。

PortRoyal是3DMARK中專門針對光追性能的測試項，RTX 4060相較RTX 3060的提升約爲18%。對比RTX 4060 Ti，相差25%左右。

而在光追測試中，RTX 4060相比RX 7600提升爲12%左右。

綜合來看，RTX 4060的傳統理論性能相較RTX 3060的提升約爲20%。

下面我們再來看看3DMARK中新增的一些具體應用場景的測試。

Speed Way測試是3DMARK最新更新的用於測試DirectX12 Ultimate 性能的顯卡基准測試。要運行此測試，顯卡必須支持 DirectX 12 Ultimate 並包含 6GB 及以上顯存。

這項測試結合了實時光线追蹤和傳統渲染技術來測量顯卡性能。場景含有光线追蹤反射、實時全局光照、網格着色器、體積照明、粒子和後處理效果。所以SW的測試基本可以看做次世代3A遊戲基准。

RTX 4060對比RTX 3060，從1080p分辨率到4K提升依次爲：14%/17%/17%。

對比A卡方面，由於DX12本身就是AMD弱項，而其中又加入了大量光影效果，無異於雪上加霜，所以分數下降的比較厲害。

另外我們使用3DMARK剛剛更新的DLSS 3進行了相關性能測試。不過由於RTX 3060無法开啓，這裏使用DLSS2進行對比測試。

在2K分辨率下DLSS开關相比RTX 3060的提升爲34%/17%；4K分辨率由於關閉情況下顯卡幾乎無法正常運行，僅看开啓狀態，提升約爲61%。

4 常規遊戲性能測試

在遊戲測試中，如有提幀技術，AMD顯卡开啓FSR質量，NVIDIA則對應开啓DLSS質量。

由於本次RTX 40系加入了DLSS 3新技術，所以後面會進行單獨測試，這裏依然選擇主流的幾款3A大作進行遊戲性能對比。

在《極限競速：地平线5》中，其中RTX 4060相比RTX 3060在1080p分辨率下提升明顯，達到33%，2K分辨率提升17%；而在4K分辨率下被RTX 3060反超，雖然只有1幀，但RTX 3060擁有12G顯存，在高分辨率下優勢更明顯。

另外1080p分辨率中，RTX 4060與RTX 4060 Ti的分數相差不大，這是因爲該分辨率下主要瓶頸在於CPU。

在《刺客信條：英靈殿》中，RTX 4060相比RTX 3060的提升分別爲：1080p提升23%；2K提升17%；4K提升11%，綜合提升17%。

在傳統光柵化遊戲中，RX 7600整體分數與RTX 4060差不多，不過刺客信條系列怎么說也是阿育傳統遊戲，按理說分數應當反超RTX 4060才對。

在《無主之地3》中，RTX 4060相比RTX 3060的提升分別爲：1080p提升22%；2K提升20%；4K分辨率相差2幀。

另外A卡在《無主之地3》的測試中，表現一直比較穩定，在1080p分辨率下，與RTX 4060 Ti的差距只有不到10%。

本次的純光追遊戲測試中就不帶A卡了，其實在SW測試中，與光追遊戲場景相似。

《光明記憶：無限》的光追測試軟件是獨立於遊戲的測試工具，比遊戲中用到的光线追蹤技術更多，測試條件爲“RTX最高/DLSS質量”。

性能方面，RTX 4060相比RTX 3060的提升分別爲：1080p提升31%；2K提升20%；4K提升6%，綜合提升19%。

在另外一款國產遊戲《邊境》的跑分軟件中，情況基本與《光明記憶：無限》相同，測試條件均在“RTX最高/DLSS質量”下進行。

在《邊境》中，RTX 4060相比RTX 3060的提升分別爲：1080p提升39%；2K提升24%；4K提升29%，綜合提升31%。

最後的測試中我們在《賽博朋克2077》體會一下不同的光影模式。

超級畫質

光追超級

光追過載

從上至下依次爲超級畫質/光追超級/光追過載。可以看到光追過載相比光追超級更貼近於真實效果。它模擬了真實的光线路徑，其實相比之前的光线追蹤模擬了更多光线在不同表面的反射，完整的計算出了場景的真實光照，避免了上一代光追中出現“死黑”的情況。

這也是NVIDIA致力於打造的下一代光追場景，但是截止目前它對硬件計算的需求太過龐大，即便是旗艦顯卡，也無法在4K分辨率下流暢運行。

5 DLSS 3性能測試

截止目前，已有超過300款遊戲和應用支持DLSS，其中已有38款遊戲和應用支持最新的DLSS 3。

包括《逆水寒》、《微軟模擬飛行》、《毀滅全人類2：重新探測》、《瘟疫傳說：安魂曲》、《光明記憶：無限》、《暗影火炬城》、《F1 22》、《生死輪回》、《漫威蜘蛛俠：重制版》、《超級人類》、《極限競速：地平线5》、《賽博朋克2077》、《紅霞島》、《暗黑破壞神IV》、《侏羅紀世界：進化2》等等。

本次DLSS 3的測試圖表比較繁瑣，並且增加了1% Low FPS和延遲的測試，1% Low FPS則是將一段時間內的幀數從大到小排列，取最小的1%出來，再對這1%的數求平均值。

在坐標軸左側的爲延遲（越低越好），坐標軸右側的均爲幀數（越高越好），並且由於牽扯到正負坐標，所以兩側的值有可能會不同。

在《侏羅紀世界：進化2》中，DLSS 3的表現非常亮眼，由於此類模擬經營遊戲的特點就是同屏單位多，更加佔用CPU資源，而DLSS 3能夠進行幀生成，來突破CPU瓶頸限制。

不過幀生成並不是毫無弊端，這也是爲什么此次測試加入了延遲。並且在开啓DLSS 3後，NVIDIA Reflex是捆綁开啓的。

在《巫師3》光线追蹤的測試中，由於沒有benchmark，我們選擇畫面元素較多的固定場景截取幀數，故1% Low幀數較高。

RTX 4060即便在DLSS 2开啓的情況下也只有49幀，但开啓DLSS 3後，能夠達到80幀的流暢水准，並且延遲相較關閉DLSS有大幅提升。

《極限競速：地平线5》是最新加入DLSS 3的遊戲，在开啓DLSS 2後有10幀左右的提升。

《暗影火炬城》在开啓光追後對於性能要求明顯提高。其中DLSS 3相比DLSS關的幀數提升了63%，DLSS 2的提升則達到了44%。

6 AV1編碼測試

本次AV1編碼測試選擇了剪映專業版，它可以輸出H.264/HEVC/AV1三種編碼格式的視頻。

剪映專業版目前自帶AV1編碼輸出，在實際測試中，我們導出一段1分鐘左右的視頻。可以看到兩個文件容量相差103MB。

由於AV1編碼特性，生成文件的比特率更低，但視頻清晰度則完全相同。所以如果生成同比特率，同容量的文件，AV1將會更清晰。

我們通過NVIDIA ICAT來進行兩段視頻的畫面對比，圖中左側爲H.264編碼，右側爲AV1編碼。在100%的細節對比中，幾乎看不出任何區別。

7 D5渲染測試

D5是一款國內實時光线追蹤渲染器，支持多種建模軟件直讀，包括SketchUp、3Ds MAX、Rhino、Revit、Archicad、Blender、C4D等。目前也已經支持DLSS 3，下面我們分別看看幀數和功耗的情況。

選擇軟件自帶的默認場景【簡約客廳】

在實時幀數表現上，由於D5採用實時GPU渲染，所以壓力全在顯卡。可以看到在DLSS關和DLSS 2的情況下兩款顯卡差別不大，但是採用DLSS 3幀生成後，RTX 4060一舉達到70幀。對於不要求高幀率的渲染軟件來說，能夠流暢轉動視角就夠了。

功耗方面，RTX 4060的TDP爲115W；RTX 3060的TDP爲170W。關閉DLSS的情況下，兩張顯卡幾乎都處於滿載狀態。DLSS 2开啓後能夠緩解一部分壓力，DLSS 3則能夠讓RTX 4060僅用60W流暢運行軟件。

8 RTX VSR（RTX Video Super Resolution）測試

目前RTX VSR（RTX Video Super Resolution）已經在部分瀏覽器中進行測試，首先玩家需要更新到NVIDIA最新驅動，在NVIDIA控制面板中的【調整視頻圖像設置】可以看到最新的RTX 視頻增強超分辨率。

RTX VSR是 AI 圖像處理的突破，它超越了傳統的邊緣檢測和特徵銳化技術，極大地提升直播視頻內容的質量。

开啓RTX VSR不僅需要最新版驅動，還需要使用RTX 40或30系列GPU，並且幾乎適用於Google Chrome和Microsoft Edge瀏覽器中的所有視頻內容（瀏覽器也需要更新到最新版本）。

开啓後，目前已知的打开YouTube或者B站，都可以享受到RTX VSR效果的加成。

如果不確定，在全屏播放視頻時，可以打开任務管理器，看到GPU負載增加，即爲开啓成功。

（點擊放大查看原圖）

我們打开YouTube隨意觀看視頻，在打开RTX VSR後，可以清晰明顯的看到水下珊瑚的質量明顯提高，邊緣更爲清晰，並且極大減少了失真現象。

9 溫度及功耗測試

功耗測試中，我們選擇FurMark軟件進行拷機測試，並採用GPU-Z檢測溫度，功耗僅計算顯卡自身。

可以看到RTX 4060這張顯卡但通過1小時左右的拷機測試，溫度一直控制在60℃左右，熱點溫度在70℃左右。不過這張卡並非FE公版，所以這裏注意功耗即可。

遊戲動態功耗測試

本次我們在拷機測試中最大板載功耗爲115W左右。但在實際遊戲測試中要低很多。

由於不同遊戲負載不同，GPU的實際功耗是動態變化的，類似於FPS隨時間的變化，RTX 40系列很難觸及功耗牆。

RTX 4060 3A遊戲平均功耗

RTX 3060 3A遊戲平均功耗

在實際的遊戲功耗測試中，我們選擇《刺客信條：英靈殿》自帶benchmark，畫面設置最高、2K分辨率，來拉滿兩張顯卡的性能極限，檢測我們實際應用場景的功耗。

可以看到兩款顯卡雖然均爲60級別，但剛剛發布的RTX 4060平均功耗只有94W，而RTX 3060則是158W，低了64W，這的確是一個驚人的成績。

遊戲平均不到百瓦的功耗，對於長時間使用電腦，或者像我這種不愛關機的用戶來說，確實能夠有效降低電費，尤其是在南方，這種電費奇高的地區。

或者在一些相對極端的使用環境中，如網咖，電腦基本都是24小時滿載運轉。RTX 40系的超低功耗，對於網咖老板確實是極大地利好消息。

10 不到100W的性能小鋼炮

目前NVIDIA已經推出兩張60級別顯卡，RTX 4060 Ti定位1080p分辨率下百幀光追遊戲，而RTX 4060則是能夠流暢運行。在有DLSS 3加持下的情況，也能夠達到差不多的成績。

不過通篇測試下來，我還有一些個人見解：

RTX 4060主要的用途並不是和誰飈光追成績，更大的意義在於純粹的迭代60級別顯卡。

本次RTX 4060相比RTX 3060綜合提升在20%左右，而RTX 4060 Ti相比RTX 3060 Ti的綜合提升在12%左右。光柵單元與RTX 4060 Ti相同，都是48個，其實算是誠意滿滿，不過想必大家一定還會吐槽顯存縮減。

享受過12GB大顯存的好處，此次RTX 4060又回到了標准的8GB，顯然讓人難以接受。

在1080p分辨率下無所謂顯存大小，但在2K分辨率差距逐步顯露，甚至4K分辨率讓RTX 3060扳回一城。不過對於遊戲玩家來說能購买RTX 4060，大概率也不指望在2K分辨率下玩遊戲。

但顯存縮減對於很多入門的內容創作者，有較大影響。畢竟像D5這種很快集成DLSS 3的應用並不多，大量軟件在實時預覽時仍是靠顯存支撐。

功耗方面，這張RTX 4060再次帶給人很大驚喜，實際使用功耗不到100W，這基本是夢回GTX 1060的級別了。想想我自用的30系顯卡，滿載打遊戲，整機功耗瞬間400W以上。在南方的話，長時間可是一筆不小的开支。

最後，想必大家也會關心RTX 4060與RX 7600如何選擇的問題。

價格方面，RX 7600首發售價2149元；RTX 4060首發售價2399元，差了250……

這兩張顯卡如何選擇，還要看玩家傾向於什么類型的遊戲。如果日常喜歡嘗試光追，或一些次世代大作，以DX12遊戲爲主，那么選擇RTX 4060無需猶豫。

如果日常以網遊，或傳統光柵化遊戲爲主，那么RX 7600顯然更有性價比。

本次RTX 4060首發價格2399元，相比上一代RTX 3060 12G還便宜100元，綜合提升達到20%，對於5000元預算裝機的用戶，它稱得上一張很好的60級別迭代產品。

盡管目前很多第三方RTX 3060 12G顯卡價格已經跌破2000元，但別忘了那場幾乎顛覆行業的“礦潮”，所帶來的後續影響。

而且RTX 4060確實能給1080p主流玩家，帶來更好的光追遊戲體驗，一張【全新】的RTX 4060，它不香嗎？

標題：NVIDIA GeForce RTX 4060首測不到100W搭載DLSS3的性能小鋼炮

地址：https://www.utechfun.com/post/231398.html

鄭重聲明：本文版權歸原作者所有，轉載文章僅為傳播信息之目的，不構成任何投資建議，如有侵權行為，請第一時間聯絡我們修改或刪除，多謝。

標籤：

上一篇:【手慢無】真的便宜啦！技嘉RTX3060TI 台式電腦遊戲顯卡僅需2799元！

下一篇:【手慢無】高度耐用，banq 128GB TF（MicroSD）存儲卡暴跌了！

您現在的位置：首頁智能硬件

NVIDIA GeForce RTX 4060首測不到100W搭載DLSS3的性能小鋼炮

猜你喜歡

您現在的位置： 首頁 智能硬件

猜你喜歡

您現在的位置：首頁智能硬件