華爲打得過英特爾和英偉達GPU縮水版,關鍵看昇騰910B帶寬和內存

2024-04-19 18:11:05    編輯: robot
導讀 上周,META、谷歌與英特爾幾乎同時官宣了下一代AI芯片。與前兩家主要用於自己的算力基礎設施不同,英特爾主要面向客戶出售最新的Gaudi 3,當然也包括中國客戶。 在最近公布的Gaudi 3白皮書中...

上周,META、谷歌與英特爾幾乎同時官宣了下一代AI芯片。與前兩家主要用於自己的算力基礎設施不同,英特爾主要面向客戶出售最新的Gaudi 3,當然也包括中國客戶。

在最近公布的Gaudi 3白皮書中,英特爾遮遮掩掩地介紹了中國獨享的兩款芯片型號:更適用於數據中心或高性能計算環境的HL-328,以及更泛用的HL-388。兩者的熱設計功率(TDP)都是450W,低於同類其他款型,預示着算力性能的下降。

標注PRC的爲滿足出口中國的政策的型號;OAM爲更適用於數據中心的型號;TDP爲熱設計功率,HBM爲高帶寬存儲器,容量大小均爲128GB,帶寬均爲3.7TB/s,緩存均爲96MB。

美國曾多次明令要求英偉達、英特爾與AMD等芯片巨頭,限制對華銷售的AI芯片的性能,最重要的標准之一,就是總處理性能(TPP)不得高於4800。在這個限制條件下,中國版的Gaudi 3BF16精度下可能只有148 TFLOPS的性能,基本與H20處於同一水平。在算力指標上,兩者幾乎與標准版相比都縮水了90%左右。

中國版的Gaudi 3可能與標准版一樣,仍然是2個晶片(die)相連的形式。這有助於降低性能密度(PD)的指標,滿足美國去年底更新的限制政策。

但英特爾尚未官方確認這幾點。市場要到今年6月與9月才能先後拿到這兩款中國版的芯片。在此之前,對英特爾如何採取了哪些手段來降低算力性能,只能歸於猜測。一種猜測是大幅削減內核數量,另一種猜測則是降低時鐘頻率。Semianalysis曾在分析H20如何“縮水”的時候分析過,前一種方式是硬件閹割,很難恢復,後一種則有辦法破解,並暗示美國政府要好好查查,英偉達到底怎么做的。最近就有消費級顯卡RTX 4090 D超頻突破限制的傳言。

不過,在白皮書中,中國獨享版的芯片在高帶寬存儲器(HBM)的容量與帶寬,緩存,以及互聯與擴展等指標上都沒有縮水。

AI加速並不只是一個算力問題,它越來越是一個內存問題。更高的內存與帶寬,能夠提高多卡互聯環境中的實際利用率(MFU)。還是Semianalysis,它在分析H20如何“縮水”的時候又暗示了,如果一款芯片已經因爲內存牆問題,實際效率降得很低,那么用相同的內存去處理更低的算力,實際效率反而提升了,這就會導致整體性能的下降,並沒有算力指標下降來得那么嚴重。卡間互聯與服務器互聯的速率指標,則會影響到計算集群規模的擴展性。

無論是英偉達、英特爾還是AMD,它們都是追求盈利的企業,希望從中國市場獲取利潤,會想方設法滿足中國客戶的需求,至少在部分指標上仍保留對國產替代的優勢。它們仍有牢固的生態優勢,還开始打起了價格战,甚至通過媒體“哭窮”:每生產一塊H20,就意味着少生產一塊H100HBM沒有下降,又在物料成本中佔了相當比重。

此前,英偉達在禁令後,將A100H100縮水成算力略低,帶寬略低的A800H800,馬上遭到美國的封堵;此後,又基於H200縮水成算力大幅降低,內存和帶寬與互聯略微降低的H20事實上,在內存容量與帶寬等指標上,H20相對H100反而有了提升。

它與華爲的昇騰910B走了差異化競爭的路线,後者擁有更高的算力,但市場期望國產芯片中能誕生一款在內存容量與帶寬,以及卡間互聯與服務器間互聯上有進一步提升的AI芯片。

低算力+高內存/互聯,仍然可以通過構建大規模計算集群的方式,滿足較高參數規模的大模型的訓練、微調與推理,就是有點貴;對於高算力+低內存/互聯的芯片來說,構建穩定高效的大規模計算集群會有一點工程挑战,在相對較小的垂類大模型的訓練與推理上更有性價比。

Gaudi3的中國專享版走的也是低算力、高內存、高互聯的路子,只不過內存與H20相比存在代差。市場對Gaudi3搶走英偉達的市場並不樂觀,它的中國專享版同樣如此。英偉達的H20已經在今年一季度小批量交付,預計在二季度大批量交付。投行KeyBanc資本調研了供應鏈客戶稱,H20的出貨量“遠高於預期”,有望在今年創收超過90億美元。

目前,還沒有針對英偉達最新的B200的中國版的消息。AMD最新的MI300的縮水版,據傳稱爲MI309,已經被美國打了回去,嫌它還不夠弱。

如果這一代的中國特供版AI芯片仍是H20佔據主流,那么英偉達在中國的好日子將在2025年之後臨近終點。Semianalysis在分析H20的競爭力的時候表示,中國自研HBM开始出樣,華爲AI芯片的產能也在爬升。

我們是不是該擔心一下,美國到時候會放松一下限制出口的門檻,用性價比更高的B20衝擊一下中國的國產替代市場。



標題:華爲打得過英特爾和英偉達GPU縮水版,關鍵看昇騰910B帶寬和內存

地址:https://www.utechfun.com/post/359898.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡