A800炒至12萬元!國產AI芯片困境中期待曙光
作者/ IT時報記者 範昕茹
編輯/ 錢立富 孫妍
當地時間8月8日,在美國洛杉磯舉行的計算機圖形學專業會議SIGGRAPH 2023上,身着經典皮衣的英偉達CEO黃仁勳宣布推出新一代AI超級芯片DGX GH200 Grace Hopper。
據了解,GH200採用了英偉達的Hopper GPU架構,並與ARM的Grace CPU架構結合起來,比H100數據中心系統容納更多內存和更大帶寬,即141GB的HBM3e內存,以及每秒5TB的帶寬。
大模型熱潮持續,英偉達再度迭代AI芯片產品,不斷強化自己在行業內的“統治力”。而在國內AI芯片市場,受地緣政治等影響,AI芯片一片難求,在倒爺“滿天飛”、賣家亂報價的情形下,國內大模型廠商急需國產方案來替代。
倒爺“滿天飛”
A800單卡售價12萬元
“A800有貨,想要的直接點擊購买”“A800現貨,支持驗貨”……國內掀起大模型浪潮後,英偉達A800成爲暢銷貨。用於售賣闲置物品的闲魚,如今已經化身A800芯片二手市場。留言區還有人指路,抖音上某账號有貨,100塊。
面對《IT時報》記者的詢價,賣家們顯得尤爲積極,在溝通過的4、5位賣家中,每位都表示手頭有全新現貨,但庫存不多,僅有30、40片左右。這些賣家的報價普遍在11萬元以上,低至11.15萬元,高至11.5萬元。相比於今年4月份的價格,A800單片價格上漲了1萬元左右。
“你最好今天就訂,明天說不定就沒貨了。”一位賣家在電話裏催促《IT時報》記者交定金。
“今天已經有7、8個人來問過了。”看記者有些猶豫,另一位賣家說道。爲了讓記者相信他手頭確實是現貨,賣家特意拍了包裝好的視頻,表示拍下就發貨,“今天拍,明天就可運到”。
“只有服務器廠家才有卡,其他只是二道販子,單純吆喝而已。”一位芯片渠道商這樣形容國內A800芯片市場的現狀。
另一位賣家也告訴記者,最近英偉達的A100、A800十分緊俏,來詢價的人特別多,但真正下單的少,大多是炒貨的。他表示:“如果需要找貨,需要談價錢,再籤合同交定金。”根據貨量多少,定金從30%到50%不等,貨量越大,定金越高。“之前我們就遇到過,有人訂了貨後又不要了,我們怎么辦?爲了規避風險。”最終,這位賣家報價A800單片10.7萬元,但到貨需要等2個月。
相比水漲船高的A800單片行情,A100服務器整機的價格浮動並不大。在該賣家的朋友圈記者看到,2周前,安裝有8塊A100芯片的服務器,售價在每台140萬——145萬元之間。但服務器的貨源依舊緊缺,賣家告訴記者:“前幾天到貨10台服務器,一個星期之內就被上海买家訂完了”。
2天後,該賣家又聯系記者,稱A100芯片有貨,而且打折銷售,只需5萬元一塊,因爲是二手的,保質期還有1年半。他還表示,全新的A800芯片也有,但相比兩天前,價格上漲了1萬多元,12萬元一塊,“價格上漲是因爲要的人多,但貨很少”。
實際上,在這一輪大模型熱潮中,即便是服務器廠商,也面臨着“地主家沒有余糧”的尷尬局面。記者詢問多家雲服務廠商,其中兩家規模較大的雲廠商表示,暫時沒有存貨。另一位服務器經銷商則表示,8月騰訊雲將上架部分A800的卡,可以提前預定,但數量和價格都未曾透露。
早在今年4月舉行的業績電話會議上,台積電方面表示,AI相關需求“爆單”,要到2024年底才能完全解決AI芯片的供應短缺問題。根據中國台灣地區媒體《電子時報》的報道,由於台積電先進封裝產能不足,英偉達正在考慮將部分GPU中使用的2.5D封裝交給其他供應商。
台積電日前宣布,規劃斥資近900億元新台幣在中國台灣地區竹科銅鑼科學園區設先進封裝晶圓廠,新工廠預計2026年底建成,2027年第三季度开始量產。但遠水解不了近渴,在芯動力科技有限公司相關負責人看來,考慮到地緣政治形勢短期內很難改變,自主可控成爲新一代芯片的要求,國內訓練芯片短缺的情況可能會持續2至3年。
生態、性能有差距
國產芯片替代成本或更高
英偉達芯片全线缺貨,用國產芯片來替代是更好的方案嗎?
“國產芯片更貴。”對於這個問題,一位芯片渠道商回答道。
盡管在價格方面,國產GPU芯片有一定的優勢,但英偉達在計算方面建立的完善生態,讓大多數廠家對英偉達的芯片趨之若鶩,而對改換國產芯片躊躇不前。
在今年的世界人工智能大會上,一家國產GPU廠商銷售人員就透露,目前國內第一批大模型廠商使用的基本都是英偉達A100、A800的芯片,因爲英偉達構建了完善的CUDA生態。“如果你用慣了這個生態,”該銷售人員說,“貿然換一個生態,意味着你的學習成本、試錯成本、調試成本都會增加,自然沒人會想要換了”。
縱觀國內AI芯片第一梯隊的海光、華爲和寒武紀等廠商,除了海光的DCU產品深算系列採用了兼容通用的“類CUDA”環境,華爲的昇騰系列採用了自研的達芬奇架構,大模型廠商在使用相關芯片時,需要提前針對軟硬件進行調配和優化。寒武紀的產品雖然包含了雲端和邊端芯片,但由於其ASIC的芯片架構,在使用時也需要提前進行調試,對通用性計算而言,ASIC芯片的成本優勢並不明顯。而對於第二梯隊的燧原、昆侖芯、天數等公司來說,生態建設更是不得不面對的難題。
生態和易用性已經將一部分小型大模型廠商拒之門外,性能更是許多廠商猶豫不決的原因所在。無論走通用GPU路线,還是走ASIC芯片路线,國內芯片廠商在性能上都對標英偉達芯片。但是,單片性能接近是否意味着整體計算性能達到英偉達算力水平?
和過去PC時代不同,大模型訓練需要巨大的算力,並非一兩顆芯片所能支撐。在當下的大模型浪潮中,芯片集群成了行業解決算力問題的一大方向。
“芯片集群並不是單純做加法,1+1不一定等於2。”中國信通院華東分院人工智能與大數據事業部副主任常永波說,“在芯片行業,1+1往往小於2。”由於在計算過程中,數據需要在芯片之間互通,這就要求芯片之間保持高帶寬,以減少算力的損耗。而且,如何在計算過程中提高芯片的算效,也是各大芯片廠商面臨的難點之一。凡此種種,都意味着單顆芯片的紙面算力和實際算力之間存在差距。
目前,國產芯片在算力上和英偉達的AI芯片仍然存在差距,這意味着,想要達到同樣的算力,需要企業購置更多的芯片。對企業而言,就意味着更多的成本支出。“打個不恰當的比方,就好像你原來用iPhone,突然換成了一台國產手機。”一位芯片賣家解釋說,“爲了達到同樣的性能,你得买好幾台國產手機,成本自然就上去了。”
國產化方案箭在弦上
AI算力需求結構將改變
盡管在目前的AI算力芯片市場上,英偉達仍是很多大模型廠家的第一選擇,但這樣的局面或將改變。
“今年,一些公共服務平台,尤其是涉及到政府機構、學校、中小企業的這種公共服務平台,已經开始使用國產AI芯片。”常永波告訴記者,國內已經开始構建AI芯片國產化生態。
今年3月,《科技部辦公廳關於开展國家新一代人工智能公共算力开放創新平台申報工作的通知》明確表示,公共算力平台應使用自主研發的人工智能計算芯片,並優先採用自主研發的系統軟件。對於混合部署的公共算力平台,基於自主研發芯片的算力標稱值佔全部系統算力標稱值的比值應不低於 60%。公共算力平台應優先使用國產开發框架,使用率應不低於60%。
今年6月2日,《臨港新片區加快構建算力產業生態行動方案》發布,其中提出:到2025年,臨港新片區將形成以智算算力爲主、基礎算力和超算算力協同的多元算力供給體系,算力產業總體規模突破100億元。
同一天,中國電信臨港公共智算服務平台暨國產GPU聯合創新基地啓動。首批國產GPU廠商華爲、燧原、天數、寒武紀、沐曦等宣布入駐。在今年的世界人工智能大會上,中國電信相關負責人表示,國產GPU聯合創新基地將面向开發者或开發企業在模型算法算力的需求,搭建異構國產算力开發環境。同時,基地還將與國產GPU廠家一起提升國產GPU芯片的性能和兼容性。未來,基地也會拿出機架,免費提供給國產GPU廠商使用,進行專業的測評服務,推動國產GPU的商業化和產業化。
在常永波看來,這一輪AI芯片的短缺,主要還是由於短時間內大模型的集體爆發。由於大部分廠商的大模型都處在前期訓練階段,對訓練算力的需求非常大,加之AI算力產能不足,最終導致AI芯片的供需失衡。但隨着大模型發展進入應用推理階段,大模型訓練帶來的龐大算力需求未必能夠一直持續。
“從目前來看,如果說大模型公司的需求70%是訓練算力,那么30%是推理算力,”常永波說,“3、5年之後,大模型訓練需求就會退潮,變成30%的訓練算力加70%的推理算力。”到那時,AI芯片的算力需求結構將顯著改變。
在目前“缺芯”狀態下,常永波認爲,國內大模型廠商可以在非商業化場景部署國產芯片,支持國產芯片廠商技術迭代,共同營造生態,共同成長。
排版/ 季嘉穎
圖片/ 英偉達 闲魚 東方IC
來源/《IT時報》公衆號vittimes
E N D
大家都在看
請加「星標」不錯過我們
本文作者可以追加內容哦 !
標題:英偉達芯片兩天漲1萬元 瘋炒之下急需國產替代
地址:https://www.utechfun.com/post/250530.html