GPU芯片新技術出現，中國廠商值得借鑑

2023-11-11 18:10:42 編輯： robot

導讀來源：半導體產業縱橫 11月6日，在創業三年，即將進入下一個三年之際，摩爾线程創始人兼CEO張建中給公司全體員工發了一封信。信中提到了很多關於過去三年研發工作的總結，以及未來發展規劃的內容，不過，這...

來源：半導體產業縱橫

11月6日，在創業三年，即將進入下一個三年之際，摩爾线程創始人兼CEO張建中給公司全體員工發了一封信。信中提到了很多關於過去三年研發工作的總結，以及未來發展規劃的內容，不過，這封信的核心內容是：摩爾线程將進行一次崗位優化，也就是裁員。

對於這家中國本土新崛起的GPU芯片設計公司來說，最近幾年的形勢，使得擺在他面前的機遇和挑战都顯得很凸出。

不僅摩爾线程，壁仞科技和沐曦集成電路也是近幾年中國本土表現非常凸出的GPU芯片創業公司，再加上老牌的景嘉微，以及其它幾家相關企業，把中國本土GPU技術和芯片產品市場熱度推向了一個新高度，在主動與被動之間，取得了明顯多於、快於2018年之前的成績。

然而，在市場和美國政策的雙重壓力下，特別是近期美國政府將壁仞科技和摩爾线程列入了實體清單，使得它們設計出的芯片難以拿到先進制程產能，再加上市場寒冬，以及在生態系統方面與英偉達的巨大差距，生存和發展愈加艱難，裁員難以避免。

GPU及生態系統建設

1999年10月，英偉達發布了GeForce 256，這是一款基於台積電220nm制程工藝、集成了2300萬個晶體管的圖形處理芯片。英偉達把Graphics Processing Unit的首字母“GPU“提煉出來，把GeForce 256冠以“世界上第一塊GPU”稱號，巧妙地定義了GPU這個新品類，並佔據這個詞的用戶心智直到今天。憑借先發優勢，不僅在芯片端，英偉達在GPU生態系統建設方面也是統治者，直到今天，也沒有哪家廠商能夠動搖它的根基。

GPU原本是爲圖像而生的，它把CPU從圖像顯示的苦力活中解放了出來，大量的流水线架構，使得GPU非常適合巨量、重復性的工作，自從GPU大規模應用以後，CPU就擺脫了這些原本由它負責的頭疼工作，轉而去做更擅長的指令判斷和控制類的“大腦“型工作。

在發展的很長一段時間內，由GPU組成的顯卡主要用於大型遊戲、CAD制圖和視頻剪輯等圖像處理工作，後來，隨着應用和技術的發展，GPU又滲透到自動駕駛、醫療影像、金融模型、生物信息等多個領域。如今，GPU是人工智能（AI），特別是AI訓練應用領域的明星，火遍全球。

發展了這么多年，GPU芯片賽道高度壟斷，全球90%的市場被少數幾家大企業佔領，在集顯市場，英特爾和AMD平分天下，在獨顯賽道，AMD、英偉達二八分成；在GPGPU（主要用於AI等高性能計算）市場，英偉達的市佔率高達90%以上。

生態系統方面，2006年，英偉達推出了並行計算平台和編程模型CUDA，它讓GPU擁有了解決復雜計算問題的能力，开發者們可以通過CUDA平台，更方便地調度底層的GPU算力。當前，CUDA擁有400多萬开發者，大部分GPU和AI芯片創業公司的產品也都通過兼容CUDA來進入用戶端。

爲了追趕英偉達，英特爾於2022年發布了全新架構的第一款獨立顯卡，擁有超過一萬名軟件工程師的英特爾，在顯卡發布後的一年裏，其顯卡驅動更新了21次，平均半年更新10版。

爲了與CUDA競爭，AMD於2016年推出了开放的ROCm平台，不過，從目前的發展情況來看，ROCm的市場接受度和應用規模依然與CUDA有非常大的差距。

中國GPU的發展近況

近些年，中國GPU取得了一些突破。

2019-2020年，中國本土出現了GPU、AI芯片創業熱潮，壁仞科技、摩爾线程、燧原科技、沐曦集成電路、天數智芯等一批明星企業湧現出來，相關GPU芯片新品不斷。

2022年3月，摩爾线程公布了首批顯卡產品，包括面向電腦和工作站的MTT S60，以及面向服務器的MTT S2000。兩張顯卡都採用了第一代MUSA架構（Moore Threads Unified System Architecture，中文名爲“蘇堤”）。2022年11月，該公司公布了第二批產品，包括面向電腦和工作站的顯卡MTT S80，以及面向服務器的MTT S3000，這兩款產品採用了新一代MUSA架構“春曉”，並使用了PCIe Gen5插槽。

壁仞科技的高光時刻，是在2022年8月發布了首款GPGPU芯片BR100，並宣布該產品從800多個參選項目中脫穎而出，榮膺當年世界人工智能大會最高獎項SAIL獎。據悉，BR100峰值算力達到國際廠商在售旗艦產品3倍以上，創下國內互連帶寬紀錄，還是國內率先採用Chiplet技術、率先採用PCIe 5.0、率先支持CXL互連協議的GPGPU芯片。

今年6月，沐曦集成電路宣布完成AI訓練GPU MXC500的功能測算工作，同時，MXMACA 2.0計算平台基礎測試完成。

據悉，MXC500是沐曦對標英偉達A100/A800的芯片，目標算力爲FP32 15 TFLOPS（A100爲FP32 19.5 TFLOPS），兼容CUDA，預計今年底規模出貨。

以上這些廠商推出的產品，目標都是要奪取英偉達和AMD在中國本土的市場份額。然而，英偉達經歷了30年的持續積累，才取得今天的成績，中國本土GPU廠商不可能在5年左右的時間內研發出具有同樣水平和市場影響力的產品。不過，如果中國GPU芯片能達到英偉達H100芯片性能的70%，也是很有意義的。接下來的重點工作就是本土GPU生態系統建設。

中國GPU生態系統建設

比提升芯片性能更難的，是構建生態系統。英偉達不僅強在芯片硬件，更強在其軟件生態CUDA，其GPU+CUDA，就像英特爾和微軟構建的Wintel，後來者要想再創建一整套軟硬件系統的成本非常高，而且非常難，不僅僅是錢的問題。假設投入和英偉達相當的人才和資源，以3倍的發展速度追趕，至少需要10年時間才能接近英偉達的水平。

以摩爾线程爲例，理論上講，無論是GPGPU，還是桌面級應用，該公司的產品性能已經達到了英偉達中端產品水准，但實際表現並非如此。以MTT S80爲例，從遊戲愛好者的測試結果來看，其早期實際性能接近GTX1050Ti，今年更新驅動後，性能可以媲美GTX1650，能流暢運行英雄聯盟等網遊，也可以跑4K遊戲，但與RTX3060相比，依然有很大差距。

MTT S80強勁的硬件卻難以發揮理論性能，關鍵問題就是軟件適配，摩爾线程差的就是底層技術和驅動經驗的積累。據悉，MUSA架構源於IMG的PowerVR，這也從一個側面體現出該公司在GPU IP方面缺乏核心技術。

通過購买IP研發GPU是中國本土大多數廠商的選擇，包括芯動、壁仞科技等企業都是如此。該模式能夠以最小代價設計出商用產品，但是，芯片生產出來以後，軟硬件打磨就要考驗廠家的技術實力了，而這些軟實力是沒有地方購买的。

中國老牌GPU芯片企業景嘉微曾表示，做GPU，三分靠硬件，七分靠軟件。英偉達在初期的產品性能也不好，還一度被ATI壓制，後期的成功除了全新架構的助攻，驅動的打磨功不可沒。

中國本土這些GPU芯片新星大多都想兼容英偉達的CUDA，但是，在驅動軟件的適配上還差強人意，例如，早期的MTT S80只支持DX9遊戲，雖然現在歷經9次版本驅動更新後，能支持更高的DX11遊戲，但是其性能表現遠未達到硬件實際水平。

正是看到了差距，中國本土GPU廠商一直在生態系統建設方面增加投入。例如，今年，弘信電子與摩爾线程和燧原科技分別籤署了《战略合作框架協議》，以打造人工智能軟硬件基礎設施。

目前，摩爾线程已經將大部分資源分配給軟件，佔比達到70%，重點關注元宇宙和AI。沐曦已與服務器OEM、大數據中心、互聯網、運營商等行業客戶建立了合作關系，並與衆多知名高校和研究機構开展產學研合作，快速推進產業上下遊生態系統建設。

GPU的新動向

全球範圍內，在已有基礎上，GPU技術及其生態依然在向前發展，目前來看，有兩點很值得關注：一是GPU與CPU的融合，二是RISC-V的融入。

GPU 比 CPU 簡單得多；它可以更快地執行簡單的指令，執行是並行進行的，這也是GPU與CPU的最大不同之處。然而，並非所有軟件都可以輕松地並行化執行。CUDA生態系統旨在提供工具來構建可以利用GPU進行並行計算的軟件應用程序，但是，大多數軟件應用程序仍然需要CPU才能運行。

基於 CPU 的應用程序不僅更容易开發，而且大多已經構建完成。很難想象哪些公司會花費時間和精力將已經在 CPU 上運行的東西移植到GPU上。

目前，AMD、英特爾和英偉達都在CPU-GPU融合技術方面下重注。

2023上半年，AMD首席技術官Mark Papermaster表示，該公司將在2024年推出CPU-GPU 芯片，它將基於第4代Epyc架構的CPU內核與基於新一代CDNA 3架構的GPU結合在一起，也就是AMD近些年一直在宣傳的APU概念。

英特爾的CPU-GPU芯片Falcon Shores具有x86 CPU內核和Xe GPU內核，成熟產品將在2025年量產。

下面看一下RISC-V與GPU的融合。

最近，Ventana Micro Systems與Imagination Technologies合作推出了基於RISC-V的CPU-GPU平台。

Ventana計劃推出一個仿真模型，展示其基於RISV-C的CPU如何與Imagination开發的GPU協同工作。這次演示將結合Ventana的新CPU產品Veyron V2。據悉，V2將對RISC-V指令集架構進行增強，使其能與x86和ARM同台競技。

目前來看，Imagination與Ventana的合作項目距離產品量產和規模化應用還有較大距離，但是，RISC-V CPU和GPU IP融合的可用性，可能會帶來針對不同客戶端應用的新一波RISC-V平台开發熱潮。

從目前的市場和應用需求來看，RISC-V與GPU的結合是有基礎的。

在一些垂直市場，例如5G/6G通信、AI推理和視頻處理等，傳統CPU已經無法滿足這些應用的計算量需求，需要新計算方法的出現。對於圖像處理來說，內存訪問瓶頸問題已經非常凸出，需要新的解決方案，甚至是新的計算架構，看看市場上最近發布的一些人工智能和RISC-V產品，會發現一些公司發布的處理器裏面有新的ISA，它們已經开始將RISC-V和GPU IP融合使用了。

通過指令擴展將GPU功能添加到RISC-V架構中很有創意，然而，二者融合這條路並不好走，最大的攔路虎就是架構融合，以及生態系統建設，需要的時間可能很長。要將RISC-V指令集改編成非常適合GPU任務的指令集，需要大量投資來定義ISA擴展，構建高度復雜的微架構，並對开源工具進行重大調整。如果將RISC-V指令集融入GPU架構，幾乎所有RISC-V的固有優勢都將被定制化稀釋掉，另外，RISC-V核心ISA功能會限制GPU在特定領域的可用性。

雖然，有諸多挑战，但鑑於RISC-V迅猛的發展勢頭，以及其在高性能計算領域的滲透決心，與同樣在高性能計算應用領域如魚得水的GPU融合，前景還是很值得期待的。

不僅是國際巨頭，中國本土GPU廠商，特別是更具前瞻性的幾家創業公司，在發展GPU方面也需要研發更具競爭力的技術和產品，而在當下美國政府推出各種限制政策的大環境下，中國本土GPU芯片技術和生態系統建設可以拓展更多思路，將更多先進的技術和理念融入相關產品。在本土企業客戶給出更多採用和試錯空間的情況下，中國芯片企業或許可以加快追趕國際先進GPU的步伐。

標題：GPU芯片新技術出現，中國廠商值得借鑑

地址：https://www.utechfun.com/post/289582.html

鄭重聲明：本文版權歸原作者所有，轉載文章僅為傳播信息之目的，不構成任何投資建議，如有侵權行為，請第一時間聯絡我們修改或刪除，多謝。

標籤：芯片 GPU 英偉達摩爾 CUDA

上一篇:劉強東回宿遷老家爲母親祝壽……

下一篇:GPTs正式上线！全民自定義ChatGPT助手時代來啦

您現在的位置：首頁智能設備

GPU芯片新技術出現，中國廠商值得借鑑

猜你喜歡

您現在的位置： 首頁 智能設備

猜你喜歡

您現在的位置：首頁智能設備