AI 新盛世》取得 NVIDIA 高階產品受阻,中國八家 AI 晶片廠商自研進度盤點

2024-02-19 08:05:00    編輯: TechNews
導讀 ChatGPT 大模型引發的生成式 AI 熱潮仍在繼續,算力硬體是生成式 AI 的核心基底,核心環節包括伺服器、網路設備、存放裝置、晶片、IDC 建設、光通信等。由於生成式 AI 需要大量計算與資料...


ChatGPT 大模型引發的生成式 AI 熱潮仍在繼續,算力硬體是生成式 AI 的核心基底,核心環節包括伺服器、網路設備、存放裝置、晶片、IDC 建設、光通信等。由於生成式 AI 需要大量計算與資料處理,AI 晶片需求旺盛增長,以 NVIDIA 為代表的半導體大廠業績與股價暴漲,相關產品長期供不應求。

AI 強勢推動下,全球廠商爭相布局 AI 晶片,中國也不例外。目前中國 AI 晶片廠商有哪些?與 NVIDIA 等大廠有何差距,又有哪些自身優勢?

AI 晶片梳理

AI 晶片廣義來講,指的是能運行 AI 演算法的晶片。但業界通常意義的 AI 晶片是指對 AI 演算法做了特殊加速設計的晶片,能處理 AI 應用中大量計算任務的模組,這一概念下,AI 晶片也被稱之為加速卡。

按技術分類,AI 晶片主要分為 GPU、FPGA、ASIC 三類;按照功能分類,AI 晶片包括訓練(training)和推理(inference)兩類;從應用場景來看,AI 晶片則包括伺服器端與移動端兩類,或者雲端、邊緣與終端三類。

全球 AI 晶片市場當前基本被以 NVIDIA 為代表的歐美大廠主導,業界資料顯示,NVIDIA 以 80% 的市佔率幾乎壟斷 AI 晶片市場。中國 AI 產業起步較晚,近幾年在美中對抗以及中國政策力挺的大環境下,中國 AI 晶片廠商逐漸嶄露頭角,在終端以及大模型推理方面表現相對出色,不過在門檻更高的GPU 以及大模型訓練環節與國外大廠相比,仍有較大追趕空間。

GPU 為通用型晶片,目前在 AI 晶片市場用量最大,通用型算力 GPU 已經廣泛應用於人工智慧模型訓練與推理領域。目前 NVIDIA 與 AMD 主導 GPU 市場,中國代表企業則包含海光資訊、景嘉微、燧原科技等。

FPGA 為半定制晶片,具備低延時,開發週期短等特性,與 GPU 相比,其適用於多指令,單資料流程的分析,而不適合複雜演算法的計算,主要用於深度學習演算法中的推理階段,美國的賽靈思和英特爾是該領域翹楚,中國代表企業包括百度昆侖芯、深鑒科技等。

ASIC 為全定制型 AI 晶片,在功耗、可靠性、 整合度等方面具備優勢,主流產品包括流 TPU 晶片、NPU 晶片、VPU 晶片以及 BPU 晶片等,國外代表廠商包括 Google、英特爾等,國內代表廠商包括華為、阿裏巴巴、寒武紀、地平線等。

中國近年也積極投入在 AI 自研晶片的領域,包含百度、阿裏巴巴、騰訊和華為等大廠皆加速自研 AI 晶片,而且 AI 晶片公司不斷湧現。

以下盤點中國 8 家 AI 晶片廠商進展:

百度昆侖芯

百度對 AI 晶片的布局最早可以追溯到 2011 年,經過七年發展,2018 年百度自研 AI 晶片──昆侖 1 正式亮相,採用 14nm 製程與自研 XPU 架構,於 2020 年量產,主要應用於百度搜尋引擎、小度等業務。2021 年 3 月,百度昆侖晶片完成獨立融資,同年 8 月,百度宣布第 2 代自研 AI 晶片──昆侖2正式量產,採用 7nm 製程,搭載自研的第二代 XPU 架構,相比 1 代性能提升 2-3 倍,通用性、易用性方面顯著增強。

百度昆侖芯前兩代的產品已有數萬片部署,第三代產品有望在 2024 年 4 月舉辦的百度 Create AI 開發者大會上亮相。

阿裏平頭哥

阿裏平頭哥於 2018 年 9 月成立,是阿裏巴巴全資半導體晶片業務主體,擁有端雲一體全棧產品系列,涵蓋資料中心晶片、IoT 晶片、處理器 IP 授權等,實現晶片端到端設計鏈路全覆蓋。

AI 晶片布局上,阿裏平頭哥 2019 年 9 月推出了其首款高性能人工智慧推理晶片──含光800,基於 12nm 製程與自研架構,整合 170 億電晶體,性能峰值算力達 820 TOPS。 在業界標準的 ResNet-50測試中,推理性能達到 78563 IPS,能效比達 500 IPS/W。

2023 年 8 月,阿裏平頭哥發布了首個自研 RISC-V AI 平台,支持運行 170 餘個主流 AI 模型,推動 RISC-V 進入高性能 AI 應用時代。同時,平頭哥宣布玄鐵處理器 C920 全新升級,C920 執行 GEMM(矩陣的矩陣乘法) 計算較 Vector 方案可提速 15 倍。

2023 年 11 月,阿裏平頭哥玄鐵 RISC-V 上新了三款基於軟硬協同新範式的處理器(C920、C907、R910),大幅提升了加速計算能力、安全性及即時性,有望加速推動 RISC-V 在自動駕駛、人工智慧、企業級 SSD、網路通信等場景和領域的大規模商用落地。

騰訊

2021 年 11 月,騰訊宣布在三款晶片上已有實質性進展,分別為針對 AI 計算的紫霄、用於影像處理的滄海以及面向高性能網路的玄靈,其中紫霄已經試生產成功並點亮。

據悉,紫霄採用自研存算架構和自研加速模組,可以提供高達 3 倍的計算加速性能和超過 45% 的整體成本節省。 紫霄晶片為騰訊內部使用,不對外銷售,騰訊通過其雲端服務出租算力獲利。

近期,媒體報導知情人士稱騰訊正考慮將紫霄 V1 做為 NVIDIA A10 晶片的替代品,用於 AI 圖像和語音辨識應用。此外,騰訊還將推出針對 AI 訓練優化的紫霄 V2 Pro 晶片,以在未來取代 NVIDIA L40S 晶片。

華為

華為在 2018 全聯接大會上提出華為 AI 戰略和全棧全場景 AI 解決方案,並發布了 2 顆全新的 AI 晶片:昇騰 910(Ascend 910)和昇騰 310(Ascend 310)。

兩款 AI 晶片均基於華為自研達芬奇架構,其中 Ascend 910(用於訓練)採用 7nm 製程,半精度達256TFOPs,功耗為 350W,運算密度號稱超越了 NVIDIA Tesla V100 和Google TPU v3。昇騰 310 屬於 Ascend-mini 系列第一顆華為商用 AI SoC 晶片,面向邊緣計算等低功耗領域。

基於昇騰 910、昇騰 310 AI 晶片,華為還推出了 Atlas AI 計算解決方案。華為昇騰社區顯示,目前 Atlas 300T 產品有三個型號,分別對應昇騰 910A、910B、910 Pro B,最大 300W 功耗,前兩者 AI 算力均為 256 TFLOPS,而 910 Pro B 可達 280 TFLOPS(FP16)。該款晶片在 2023 年已經獲得了大客戶至少 5,000 套的訂單,預計會在 2024 年交付。業界認為,華為昇騰 910B 能力已經基本做到可對標 NVIDIA A100。

由於中國國內對於華為昇騰910B 等國產 AI 晶片的需求激增,路透社近期報導華為計劃優先生產昇騰910B,而這可能將會影響到 Mate 60 系列所搭載的麒麟 9000s 晶片的產能。

寒武紀

寒武紀成立於 2016 年,專注於人工智慧晶片產品的研發與技術創新,提供雲邊端一體、軟硬體協同、訓練推理融合、具備統一生態的系列化智慧晶片產品和平台化基礎系統軟體,產品廣泛應用於伺服器廠商和產業公司。

成立以後,寒武紀推出多款晶片產品,覆蓋終端、雲端與邊緣領域。其中終端晶片包括寒武紀 1A、寒武紀 1H、寒武紀 1M 系列智慧處理器;雲端智慧加速卡包括思元 100、思元 270、思元 290 晶片和思元 370;邊緣智慧加速卡包括思元 220 晶片。

其中,思元 290 智慧晶片是寒武紀的首顆訓練晶片,採用台積電 7nm 先進製程,整合 460 億個電晶體,支持 MLUv02 擴展架構,全面支持 AI 訓練、推理或混合型人工智慧計算加速任務。思元 370 則為該公司的主力產品,採用是 7nm 製程,同時支持推理和訓練任務。此外,思元 370 也是寒武紀首款採用 chiplet 技術的 AI 晶片,整合了 390 億個電晶體,最大算力高達 256TOPS (INT8)。

璧仞科技

壁仞科技創立於 2019 年,發展路徑上,壁仞科技將首先聚焦雲端通用智慧計算,逐步在人工智慧訓練和推理、圖形渲染等多個領域趕超現有解決方案,實現中國國產高階通用智慧計算晶片的突破。壁仞科技已完成 B 輪融資,總融資額超 50 億人民幣,是中國成長勢頭最為迅猛的獨角獸企業之一。

2021 年,壁仞科技首款通用 GPU 晶片 BR100 系列試生產,2022 年 3 月 BR100 成功點亮,同年 8 月 BR100 正式發布。

據悉,BR100 系列基於壁仞科技自主原創的晶片架構開發,採用成熟的 7nm 製程,整合 770 億電晶體,16 位浮點算力達到 1000T 以上、8 位元定點算力達到 2000T 以上,單晶片峰值算力達到PFLOPS 等級。同時,BR100 結合了包括 Chiplet 等在內的多項業內前端晶片設計、製造與封裝技術,具有高算力、高能效、高通用性等優勢。

地平線

地平線是中國高效能智慧駕駛計算方案提供商,於 2015 年 7 月成立,經過幾年發展,陸續推出多款 AI 晶片,產品主要包含旭日與徵程系列,其中旭日系列面向 AIOT 市場,徵程系列面向智慧駕駛領域。

目前旭日系列已經發展至第三代,旭日 3M 和旭日 3E,分別對應高階和低階市場。性能方面,只需在 2.5W 的功耗下,旭日 3 能夠達到等效 5TOPS 的標準算力,較前一代大幅升級。

徵程系列目前已經反覆運算至第五代,徵程 5 晶片於 2021 年發布,2022 年 9 月全球首發量產,單顆晶片 AI 算力最高可達128 TOPS,支持 16 路鏡頭,可滿足車廠高等級自動駕駛的量產需求。

2023 年 11 月,地平線宣布徵程 6 系列將於 2024 年 4 月正式發布,並於 2024 年第四季完成首批量產車型交付。據悉,已有多家車企與地平線達成意向合作,包括比亞迪、廣汽集團、大眾汽車集團旗下軟體公司 CARIAD、博世等汽車領域頭部企業。

燧原科技

燧原科技於 2018 年 3 月成立,專注人工智慧領域雲端和邊緣算力,成立 5 年多已建成雲端訓練和雲端推理兩條產品線,並開發出雲燧®T10、雲燧®T20/T21 訓練產品以及雲燧®i10、雲燧®i20 等推理產品。

燧原科技已於 2023 年 9 月宣布完成 D 輪融資 20 億人民幣,由上海國際集團旗下子公司及產業基金,包括國際資管、國鑫創投、國方創新、金浦投資旗下上海金融科技基金、國和投資聯合領投,騰訊、美圖公司、武嶽峰科創、允泰資本、弘卓資本、紅點中國、廣發乾和、達泰資本、浦東投控等多家新老股東跟投。

另據媒體報導,燧原科技第三代 AI 晶片產品將於 2024 年初上市。

結語

展望未來,業界持續看好 AI 商用發展,並認為 AI 將使得大規模算力需求出現大量缺口,AI 晶片市場前景值得期待。業界資料顯示,2022 年全球 AI 晶片市場規模已經達到了 5,800 億美元,預計到 2030 年將超過兆美元。

以 NVIDIA 為代表的前段 AI 晶片廠商自然將繼續受益,與此同時中國 AI 晶片廠商也有機會在 AI 巨大風口下,縮小差距,加速成長。

(首圖來源:)



關鍵字: , , , , , ,


標題:AI 新盛世》取得 NVIDIA 高階產品受阻,中國八家 AI 晶片廠商自研進度盤點

地址:https://www.utechfun.com/post/333708.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡