英偉達背後的“諸神之爭”。

2024-03-15 18:40:08    編輯: robot
導讀 缺芯演變爲全球各行各業的痛點,催促更多的國產AI芯片企業努力追趕甚至超越。  內容/嵐羽  編輯/ TV   校對/莽夫 2024年剛开局,AI“王炸”頻現。蘋果放棄長達十年的造車計劃轉投生成式AI...

缺芯演變爲全球各行各業的痛點,催促更多的國產AI芯片企業努力追趕甚至超越。

 內容/嵐羽

 編輯TV  

校對莽夫

2024年剛开局,AI“王炸”頻現。蘋果放棄長達十年的造車計劃轉投生成式AI,OpenAI首個文生視頻模型Sora驚豔亮相,號稱比GPT-4快18倍的大模型Groq橫空出世,華爲發布首個通信行業大模型……

AI浪潮已經勢不可擋,AI芯片作爲其發展的底層基石也迎來了前所未有的機遇。據Gartner最新預測,到2024年AI芯片市場規模將較上一年增長25.6%,達671億美元。預計到2027年,AI芯片市場規模將是2023年規模的兩倍以上,達到1194億美元。

在這樣的背景下,“算力霸主”英偉達被捧上神壇,以高達80%的佔有率幾乎壟斷了市場,賺得盆滿鉢滿。英偉達數據中心業務的營收再創新高,帶動2024年財年Q4季度總營收狂漲265%。由於這份遠超預期的財報數據,英偉達一夜漲出2770億美金市值,相當於:一夜漲出阿裏巴巴+百度+京東。

英偉達的“狂飆”也引來了衆多挑战者。亞馬遜、谷歌、微軟、華爲、百度等巨頭積極推動自研芯片,寒武紀、摩爾线程、燧原科技等新銳力量崛起。據外媒報道,英偉達在提交給美國證券交易委員會的文件中,其中包含AI芯片等多個類別裏,首度將華爲認定爲“最大競爭對手”。

理想與狂熱交織下,人們不免好奇:英偉達的“鐵王座”還能坐多久?爲什么華爲被其列爲最大競爭對手?其他國產AI芯片發展如何?

Part.1

英偉達“外患”大於“內憂”

與英偉達不斷刷新預期的業績相伴相隨的是,越來越多的挑战。

正如英偉達CEO黃仁勳在一次演講中所說:“我們並不需要假裝公司處於危險之中,因爲我們能感覺到公司確實一直處於危險之中。”

英偉達目前最顯著的問題是產能。從去年开始,台積電在先進封裝方面的產能變得緊張,而英偉達芯片依賴於台積電的CoWoS封裝技術以及基於65nm硅中介層的工藝。雖然台積電已計劃將CoWoS封裝產能提高一倍,但需到2024年下旬產能才能紓解。

爲緩解產能緊張的局面,英偉達與英特爾達成了代工合作意向,初步估算英特爾每月生產5000片晶圓,如果全部用於生產H100芯片,在理想情況下最多可以得到30萬顆芯片,這也意味着英偉達高性能GPU的交貨周期將有望縮短更多。

內憂好解,外患卻不容忽視。去年12月,AMD發布了MI300系列芯片產品。AMD首席執行官蘇姿豐稱,MI300X在訓練大語言模型方面與英偉達的H100芯片相當,但推理能力更爲出色。目前,MI300系列產品已开始量產出貨,上個季度推動AMD數據中心GPU總收入超過4億美元。

英特爾也在發力謀求在市場中更大的話語權。新一代的Gaudi 3將採用先進的5nm制程工藝,配備最高達128GB的HBM3e內存,大幅提升AI的學習和訓練性能,可對標英偉達的H200芯片。

除了上述兩個直接競爭對手的“步步緊逼”,英偉達還面臨多家科技大廠的挑战。微軟發布了其首款定制化Maia 100 GPU和Azure Cobalt CPU100,以降低AI服務成本。亞馬遜和谷歌已經使用了自研芯片,並部分產品向客戶提供。OpenAI的7萬億芯片計劃和孫正義的1000億“豪賭”也在試圖分一杯羹。此外,MLIR、谷歌等都在轉向“以Python語言爲基礎的編程層”,以使AI訓練更加开放,逐漸擺脫對英偉達CUDA生態的依賴,建立起自己的護城河。

與此同時,受出口管制影響,英偉達在中國市場的收入暴跌。根據英偉達最新的財報數據,中國區2023年第四季度的營收下滑到個位數比例。如何在美國政府管制、中國客戶需求間保持平衡成爲英偉達的一道關鍵課題。

在專門爲中國市場特供的A800和H800也被禁售後,英偉達推出了新款H20,但該產品性價比並不高,性能縮水爲H100的四分之一,阿裏巴巴、騰訊、百度等中國企業明確表示今年會大砍訂單量,英偉達在中國的營收恐不樂觀。

Part.2

華爲AI芯片的自研苦旅

英偉達在曾提交給美國證券交易委員會的文件中,把華爲列爲最大競爭對手。近日在接受美國科技雜志《連线》採訪時,英偉達CEO黃仁勳再次表達了對華爲的重視,點贊“華爲盡管受到現有半導體處理技術的限制,仍然可以通過將許多芯片聚集在一起來構建非常強大的系統。”

這不僅是對華爲技術實力的認可,更是對整個AI芯片行業競爭格局的一次重新評估。申萬宏源的研究報告顯示,從2023年上半年的數據看,華爲AI服務器出貨量已成爲國產品牌第一,僅次於英偉達,且仍在快速增長。

華爲的崛起並非是“忽如一夜春風來”。2017年,華爲發布全球首款移動端AI芯片麒麟970,內置獨立NPU,相比CPU獲得了約50倍能效和25倍性能優勢。這意味着,麒麟970芯片可以用更少的能耗更快地完成AI計算任務。

一年後,華爲又發布麒麟980,憑借7nm制程工藝、雙核NPU加持等特性,麒麟980打破了多項世界第一。但是,沒有一蹴而就的成果。麒麟980歷經了36個月的研發,才完成定制特殊基礎單元構建高可靠性IP論證,再加上Soc工程化驗證的時間,留給量產的周期僅半年左右。

根據這個時間表,麒麟研發團隊實際上只能允許一次投片修正,否則就會影響芯片的正常流片、量產和終端適配,造成產品延期上市甚至是項目失敗。經過2個大版本的迭代,5000多次的工程驗證,花費了數億美元,最終麒麟980成功量產。

麒麟980成爲華爲在手機端AI芯片布局的一個重要裏程碑。在此基礎上,華爲試圖覆蓋雲、邊、端各種場景,形成從應用到系統到芯片的閉環。

2018年10月,華爲在其全聯接大會上首次提出全棧全場景AI解決方案,並“祭”出了兩顆AI芯片:華爲昇騰(Ascend)910和310。從算力上看,昇騰910表現非常出色,半精度(FP16)算力可達256TFLOPS,整數精度(INT8)算力可達612TOPS。2023年最新發布的昇騰910B是昇騰910的升級款,算力已達到英偉達A100的性能水平。

由於其卓越的性能表現,加上美國對英偉達芯片的出口禁令限制,國內企業紛紛轉投昇騰系列的懷抱。據悉,2023年華爲從中國主要互聯網公司獲得了至少5000顆昇騰910B芯片的訂單,這對英偉達在AI芯片市場的主導地位構成了嚴峻的威脅。

算力比拼僅是一方面,生態建設方面,英偉達最寬的護城河CUDA也正遭猛烈進攻。CUDA最大的特點就是,軟硬結合大幅提升了GPU的並行計算效率,具備低成本、低門檻、廣生態等優勢,兼容CUDA生態對於开發者與客戶來說更友好。但同時,容也會成爲限制產品發展的“天花板”,追隨英偉達生態難以實現突圍,自研生態才有望實現自主可控破局。

華爲以自研CANN框架對標CUDA,要直面英偉達用戶粘性的巨大挑战。CUDA推出至今,擁有超400萬开發人員和超過3000個應用程序,建立起了龐大的用戶群體與开發者社區。

雖然CANN起步較晚,離CUDA還有很大差距,但華爲也在努力追趕。目前華爲CANN平台已經到了7.0版本,支持50+主流大模型,同時兼容主流加速庫及开發套件。此外已經支持Pytorch、Tensorflow等主流框架,PyTorch 2.1版本已同步昇騰NPU,意味着开發者可直接在PyTorch 2.1上基於昇騰進行模型开發。

伴隨着“日拱一卒”的演進,華爲AI芯片終於實現“從0到1”的突破,走向了巨頭的談判桌。但“從1到100”仍需企業和產業鏈上下遊共同完善生態,剩下就交給時間。

Part.3

國產AI芯片的“繁花”時代

目前國產AI芯片主要可以分爲三類:其一是華爲、阿裏等大型科技企業自研的AI芯片,二是海光信息等國資背景的科技公司,三是寒武紀、壁仞科技、摩爾线程、燧原科技等創業型芯片公司。

華爲作爲ICT運營商,積累了完整的雲技術生態和渠道銷售能力。在各省級行政區建立代表處、派駐城市總經理的战略打法,還一度被騰訊雲和阿裏雲效仿。

阿裏平頭哥

成立於2018年的平頭哥,由中天微和達摩院自研芯片業務整合而來,依托中天微多年技術積累,結合阿裏基礎設施事業部和達摩院的前沿算法研究,技術儲備深厚。

2019年9月,含光800問世,這是平頭哥第一款通用AI推理芯片。含光800採用了自研的芯片架構,通過軟硬件的協同設計實現性能突破。在業界標准的ResNet-50測試中,含光800推理性能達到78563 IPS,比當時業界最好的AI芯片性能高4倍;能效比500 IPS/W,是第二名的3.3倍。

含光800已經大規模應用在阿裏內部核心業務中,雖然不對外售賣,但可以通過阿裏雲對外輸出AI算力。阿裏雲去年4月推出的大模型“通義千問”,就使用了含光800芯片。

海光信息

主要從事高端處理器、加速器等計算芯片產品和系統的研究、开發,是少數幾家具備高端處理器研發能力的企業之一。海光信息的產品採用X86架構,分別有海光通用處理器(CPU)和海光協處理器(DCU)。

海光的“深算一號”是公司DCU系列的主要在售產品,目前廣泛應用於數據中心、互聯網企業,在大數據處理、人工智能、商業計算等領域,已經商業化應用數十萬片。“深算一號”具備大模型運行能力,但它的水平只相當於英偉達P100的水平。2023年第三季度海光推出了“深算二號”,據透露其性能翻了一番。不過和英偉達產品相比,仍有一定差距。

燧原科技

專注於人工智能雲端算力產品,提供自主創新、全棧自研、具備完全自主知識產權的通用AI訓練和推理產品,可廣泛用於雲數據中心、超算中心、泛互聯網、傳統行業及智慧城市等多樣化場景。

成立五年多,燧原科技已推出燧思系列芯片、雲燧訓練和推理加速卡以及雲燧智算機的全系列算力產品线。基於燧原科技的自主創新芯片架構,採用12nm工藝制造的新一代燧思AI推理芯片計算能力與業內7nmGPU相當。

伴隨着大模型和生成式AI的興起,缺芯正從一個行業季節性的常態,演變爲全球各行各業的痛點,催促更多的國產AI芯片企業努力追趕甚至超越。

市場、企業、技術、產品都在變化,新的格局正在孕育當中,國產AI芯片亟需找准战略規劃的前行方向,才能避免在這副生存角逐的棋局中被碾壓踢出。

原文標題 : 英偉達背後的“諸神之爭”



標題:英偉達背後的“諸神之爭”。

地址:https://www.utechfun.com/post/346194.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡