整理 | 凌敏、核子可樂
受美國今年 10 月份頒布的最新限令影響,一夜之間,英偉達頂級旗艦顯卡 RTX 4090 全面下架。如今,事情似乎有了轉機。
1
英偉達發布中國特供版 RTX 4090D
12 月 28 日,英偉達中文網站上线了一款名爲 RTX 4090D 的顯卡,這是英偉達頂級旗艦顯卡 RTX 4090 的低性能版本,可以在不違背美國最新出口管制規定的前提下,出口中國。據悉,字母“D”意爲 Dragon,代表 2024 年農歷龍年。該顯卡將於明年 1 月正式上市。
與 RTX 4090 相比,RTX 4090D 性能降低約 10.94%,具體差異爲核心數量較少、共 14592 個 CUDA 核心,低於中國境外銷售的 16384 核心版本。
英偉達日前在採訪中表示,4090D 這張 GPU 的張量核心數也有類似幅度的削減,從 512 個減少至 456 個。除此之外,其他設計基本沒有變化,峰值時鐘速率仍爲 2.52 GHz、內存爲 24 GB GDDR6x,內存總线也繼續保持 384 位。
盡管有所“閹割”,英偉達堅稱這款顯卡的性能並沒有受到太大影響。
英偉達公司一位發言人在郵件採訪中表示,“在啓用光线追蹤和深度學習超採樣(DLSS)的 4K 分辨率遊戲當中,GeForce RTX 4090D 的性能只比 GeFOrce RTX 4090 低 5% 左右,而且運行方式與全系 GeForce GPU 沒有區別,所以最終用戶仍可進行超頻。”
這已經不是英偉達第一次爲了遵守美國出口管制條例而主動削弱顯卡性能。2022 年底,在限制對中國 AI 加速器銷售風波之後,這家美國芯片巨頭就降低了廣受歡迎的 A100 GPU 的互連速度,由此衍生出的新版本被命名爲 A800。下一代 H100 也有同樣的低性能版本,預計將定名爲 H800。
英偉達的舉動也很快引起了美國商務部長 Gina Raimondo 的注意,她警告各芯片制造商不要觸碰禁令的底线。“我可以告訴大家,如果你們沿着劃定的邊界重新設計芯片、讓這些產品用於 AI 場景,那我第二天就會收緊控制。”
Raimondo 隨後向路透社解釋稱,美國商務部正在與英偉達密切合作,確保不會把可能對美國國家安全構成威脅的 GPU 和 AI 加速器出售給中國。當然,這家芯片大廠可以、也應該獲准在中國开展正常業務。
2
受“新限令”影響,RTX 4090 曾全面下架
此前,出口到中國的 GPU 和 AI 加速器的主要性能上限,體現在互連帶寬之上——也就是處理器之間相互通信的速度。2022 年 10 月,美國商務部工業和安全局(BIS)公布對中國出口管制新規,主要針對先進芯片和芯片制造設備領域,限制了雙向互連帶寬爲 600 GB/ 秒芯片的出口,規格在此之下的 GPU 無需額外申請許可。
作爲回應,英偉達和英特爾都調整了自家最新 GPU,主動下調互連速度以回避美國商務部的限制。比如 H800 就是典型的特供版本。
2023 年 10 月 17 日,拜登政府更進一步,對性能密度採取了新一輪管控政策。據悉,新的政策將限制 Nvidia A800 和 H800 芯片的出口,此外,新規將豁免筆記本電腦、智能手機和遊戲設備中使用的大多數消費級芯片,但其中部分芯片仍須受到美國官員的批准和專項管控。相關規定將在未來 30 天內生效。
根據商務部工業和安全局(BIS)提交的文件,新規則第一條、也是其中最重要的條款,限制了以下產品的對中出口:
“擁有一個或多個數字處理單元,且具備以下任一特徵的集成電路產品:(1)「總處理性能」(TPP)爲 4800 或者以上;或者(2)「總處理性能」爲 1600 或更高,且「性能密度」爲 5.92 或以上。”
其實 GPU 和加速器的總處理性能(TPP)分數計算非常簡單。只需要將設備的每秒密集萬億次運算(浮點或整數)的最大數字加倍,再乘以運算的位長度。對於涉及不同精度的多項性能指標(例如 INT4、FP8、FP16 和 FP32 等),則使用最高 TPP 得分。
受這一新規影響,RTX 4090 成爲唯一一款被禁止在中國銷售的消費級顯卡產品。
據悉,RTX 4090 的總處理性能(TPP)超過了 4800,略高於規定的消費級顯卡性能上限。所謂 4800,是指先將 GPU 每秒所能運行的最大萬億次運算數字(浮點或整數運算)加倍,再乘以運算的位長度。
初版 4090 的 TPP 性能爲 5285,也就是說英偉達必須獲得美國政府頒發的許可證才能在中國合法銷售這款高人氣遊戲顯卡。需要注意的是,消費級顯卡不受性能密度指標的限制,這項指標主要用於約束英偉達 L4 等性能較弱的數據中心用顯卡的銷售活動。
一時間,在京東搜索 “RTX 4090 顯卡”只有少數第三方售賣,但需要預約等待到貨。同樣,在淘寶搜索也是如此,標注價格基本 2 萬起步,最高甚至接近 4 萬元。而在二手平台鹹魚上,RTX4090 售價基本 1.2 萬起步。華碩、微星、影馳等英偉達合作商也同樣紛紛下架該型號的非公顯卡,官方旗艦店均已顯示無貨狀態。
對於“新限令”,英偉達方面曾回應稱:“我們遵守所有適用的法規,同時努力提供支持不同行業的數千種應用產品。鑑於全球對我們產品的需求,我們預計(新規)短期內不會對我們的財務業績產生實質性的影響。”
3
受影響的不只有英偉達
雖然作爲 AI 芯片市場上份額佔比最高的巨頭,英偉達肯定會首當其衝受到此項新規的影響,但英特爾和 AMD 的情況恐怕也好不到哪裏去。
雖然 AMD 當前的最高規格 GPU MI250X 已經受到去年出口政策的限制,但 MI210 從技術角度講其實低於 600 GB/ 秒的帶寬限制。不過根據估算,該卡的 TPP 得分爲 5792、功率密度爲 8,所以隨着新規的出台生效,MI210 恐怕也將告別中國市場。不過,AMD 曾公开表示他們正在开發一款類似於英偉達 A800 和 H800 的特殊加速器,專門面向中國銷售。
來自 TrendForce 的行業觀察師們表示,這些規定可能會抑制中國市場對英偉達高端 AI 服務器的需求,導致其全球需求份額從目前的 5% 到 6% 降低至 3% 到 4%。此外,TrendForce 預計字節跳動、百度、阿裏巴巴和騰訊等大型 Web 和雲服務商將在新規生效之前積極儲備 GPU 資源。TrendForce 在一份研究報告中表示,“英偉達可能也會努力將當前稀缺的資源(例如 H800)優先交付給中國客戶。”
從長遠來看,TrendForce 預計中國企業將加快芯片自主研發力度,目前阿裏巴巴打造的平頭哥 ASIC 和華爲投資的昇騰計算平台就是典型案例。與此同時,分析師們認爲中國企業還可能調整 AI 开發思路,轉而租用服務商提供的資源。
標題:英偉達發布中國特供版RTX 4090D:砍掉部分核心功能後,速度降低11%,性能只差5%
地址:https://www.utechfun.com/post/310913.html