來源:半導體產業縱橫
11月6日,在創業三年,即將進入下一個三年之際,摩爾线程創始人兼CEO張建中給公司全體員工發了一封信。信中提到了很多關於過去三年研發工作的總結,以及未來發展規劃的內容,不過,這封信的核心內容是:摩爾线程將進行一次崗位優化,也就是裁員。
對於這家中國本土新崛起的GPU芯片設計公司來說,最近幾年的形勢,使得擺在他面前的機遇和挑战都顯得很凸出。
不僅摩爾线程,壁仞科技和沐曦集成電路也是近幾年中國本土表現非常凸出的GPU芯片創業公司,再加上老牌的景嘉微,以及其它幾家相關企業,把中國本土GPU技術和芯片產品市場熱度推向了一個新高度,在主動與被動之間,取得了明顯多於、快於2018年之前的成績。
然而,在市場和美國政策的雙重壓力下,特別是近期美國政府將壁仞科技和摩爾线程列入了實體清單,使得它們設計出的芯片難以拿到先進制程產能,再加上市場寒冬,以及在生態系統方面與英偉達的巨大差距,生存和發展愈加艱難,裁員難以避免。
01
GPU及生態系統建設
1999年10月,英偉達發布了GeForce 256,這是一款基於台積電220nm制程工藝、集成了2300萬個晶體管的圖形處理芯片。英偉達把Graphics Processing Unit的首字母“GPU“提煉出來,把GeForce 256冠以“世界上第一塊GPU”稱號,巧妙地定義了GPU這個新品類,並佔據這個詞的用戶心智直到今天。憑借先發優勢,不僅在芯片端,英偉達在GPU生態系統建設方面也是統治者,直到今天,也沒有哪家廠商能夠動搖它的根基。
GPU原本是爲圖像而生的,它把CPU從圖像顯示的苦力活中解放了出來,大量的流水线架構,使得GPU非常適合巨量、重復性的工作,自從GPU大規模應用以後,CPU就擺脫了這些原本由它負責的頭疼工作,轉而去做更擅長的指令判斷和控制類的“大腦“型工作。
在發展的很長一段時間內,由GPU組成的顯卡主要用於大型遊戲、CAD制圖和視頻剪輯等圖像處理工作,後來,隨着應用和技術的發展,GPU又滲透到自動駕駛、醫療影像、金融模型、生物信息等多個領域。如今,GPU是人工智能(AI),特別是AI訓練應用領域的明星,火遍全球。
發展了這么多年,GPU芯片賽道高度壟斷,全球90%的市場被少數幾家大企業佔領,在集顯市場,英特爾和AMD平分天下,在獨顯賽道,AMD、英偉達二八分成;在GPGPU(主要用於AI等高性能計算)市場,英偉達的市佔率高達90%以上。
生態系統方面,2006年,英偉達推出了並行計算平台和編程模型CUDA,它讓GPU擁有了解決復雜計算問題的能力,开發者們可以通過CUDA平台,更方便地調度底層的GPU算力。當前,CUDA擁有400多萬开發者,大部分GPU和AI芯片創業公司的產品也都通過兼容CUDA來進入用戶端。
爲了追趕英偉達,英特爾於2022年發布了全新架構的第一款獨立顯卡,擁有超過一萬名軟件工程師的英特爾,在顯卡發布後的一年裏,其顯卡驅動更新了21次,平均半年更新10版。
爲了與CUDA競爭,AMD於2016年推出了开放的ROCm平台,不過,從目前的發展情況來看,ROCm的市場接受度和應用規模依然與CUDA有非常大的差距。
02
中國GPU的發展近況
近些年,中國GPU取得了一些突破。
2019-2020年,中國本土出現了GPU、AI芯片創業熱潮,壁仞科技、摩爾线程、燧原科技、沐曦集成電路、天數智芯等一批明星企業湧現出來,相關GPU芯片新品不斷。
2022年3月,摩爾线程公布了首批顯卡產品,包括面向電腦和工作站的MTT S60,以及面向服務器的MTT S2000。兩張顯卡都採用了第一代MUSA架構(Moore Threads Unified System Architecture,中文名爲“蘇堤”)。2022年11月,該公司公布了第二批產品,包括面向電腦和工作站的顯卡MTT S80,以及面向服務器的MTT S3000,這兩款產品採用了新一代MUSA架構“春曉”,並使用了PCIe Gen5插槽。
壁仞科技的高光時刻,是在2022年8月發布了首款GPGPU芯片BR100,並宣布該產品從800多個參選項目中脫穎而出,榮膺當年世界人工智能大會最高獎項SAIL獎。據悉,BR100峰值算力達到國際廠商在售旗艦產品3倍以上,創下國內互連帶寬紀錄,還是國內率先採用Chiplet技術、率先採用PCIe 5.0、率先支持CXL互連協議的GPGPU芯片。
今年6月,沐曦集成電路宣布完成AI訓練GPU MXC500的功能測算工作,同時,MXMACA 2.0計算平台基礎測試完成。
據悉,MXC500是沐曦對標英偉達A100/A800的芯片,目標算力爲FP32 15 TFLOPS(A100爲FP32 19.5 TFLOPS),兼容CUDA,預計今年底規模出貨。
以上這些廠商推出的產品,目標都是要奪取英偉達和AMD在中國本土的市場份額。然而,英偉達經歷了30年的持續積累,才取得今天的成績,中國本土GPU廠商不可能在5年左右的時間內研發出具有同樣水平和市場影響力的產品。不過,如果中國GPU芯片能達到英偉達H100芯片性能的70%,也是很有意義的。接下來的重點工作就是本土GPU生態系統建設。
03
中國GPU生態系統建設
比提升芯片性能更難的,是構建生態系統。英偉達不僅強在芯片硬件,更強在其軟件生態CUDA,其GPU+CUDA,就像英特爾和微軟構建的Wintel,後來者要想再創建一整套軟硬件系統的成本非常高,而且非常難,不僅僅是錢的問題。假設投入和英偉達相當的人才和資源,以3倍的發展速度追趕,至少需要10年時間才能接近英偉達的水平。
以摩爾线程爲例,理論上講,無論是GPGPU,還是桌面級應用,該公司的產品性能已經達到了英偉達中端產品水准,但實際表現並非如此。以MTT S80爲例,從遊戲愛好者的測試結果來看,其早期實際性能接近GTX1050Ti,今年更新驅動後,性能可以媲美GTX1650,能流暢運行英雄聯盟等網遊,也可以跑4K遊戲,但與RTX3060相比,依然有很大差距。
MTT S80強勁的硬件卻難以發揮理論性能,關鍵問題就是軟件適配,摩爾线程差的就是底層技術和驅動經驗的積累。據悉,MUSA架構源於IMG的PowerVR,這也從一個側面體現出該公司在GPU IP方面缺乏核心技術。
通過購买IP研發GPU是中國本土大多數廠商的選擇,包括芯動、壁仞科技等企業都是如此。該模式能夠以最小代價設計出商用產品,但是,芯片生產出來以後,軟硬件打磨就要考驗廠家的技術實力了,而這些軟實力是沒有地方購买的。
中國老牌GPU芯片企業景嘉微曾表示,做GPU,三分靠硬件,七分靠軟件。英偉達在初期的產品性能也不好,還一度被ATI壓制,後期的成功除了全新架構的助攻,驅動的打磨功不可沒。
中國本土這些GPU芯片新星大多都想兼容英偉達的CUDA,但是,在驅動軟件的適配上還差強人意,例如,早期的MTT S80只支持DX9遊戲,雖然現在歷經9次版本驅動更新後,能支持更高的DX11遊戲,但是其性能表現遠未達到硬件實際水平。
正是看到了差距,中國本土GPU廠商一直在生態系統建設方面增加投入。例如,今年,弘信電子與摩爾线程和燧原科技分別籤署了《战略合作框架協議》,以打造人工智能軟硬件基礎設施。
目前,摩爾线程已經將大部分資源分配給軟件,佔比達到70%,重點關注元宇宙和AI。沐曦已與服務器OEM、大數據中心、互聯網、運營商等行業客戶建立了合作關系,並與衆多知名高校和研究機構开展產學研合作,快速推進產業上下遊生態系統建設。
04
GPU的新動向
全球範圍內,在已有基礎上,GPU技術及其生態依然在向前發展,目前來看,有兩點很值得關注:一是GPU與CPU的融合,二是RISC-V的融入。
GPU 比 CPU 簡單得多;它可以更快地執行簡單的指令,執行是並行進行的,這也是GPU與CPU的最大不同之處。然而,並非所有軟件都可以輕松地並行化執行。CUDA生態系統旨在提供工具來構建可以利用GPU進行並行計算的軟件應用程序,但是,大多數軟件應用程序仍然需要CPU才能運行。
基於 CPU 的應用程序不僅更容易开發,而且大多已經構建完成。很難想象哪些公司會花費時間和精力將已經在 CPU 上運行的東西移植到GPU上。
目前,AMD、英特爾和英偉達都在CPU-GPU融合技術方面下重注。
2023上半年,AMD首席技術官Mark Papermaster表示,該公司將在2024年推出CPU-GPU 芯片,它將基於第4代Epyc架構的CPU內核與基於新一代CDNA 3架構的GPU結合在一起,也就是AMD近些年一直在宣傳的APU概念。
英特爾的CPU-GPU芯片Falcon Shores具有x86 CPU內核和Xe GPU內核,成熟產品將在2025年量產。
下面看一下RISC-V與GPU的融合。
最近,Ventana Micro Systems與Imagination Technologies合作推出了基於RISC-V的CPU-GPU平台。
Ventana計劃推出一個仿真模型,展示其基於RISV-C的CPU如何與Imagination开發的GPU協同工作。這次演示將結合Ventana的新CPU產品Veyron V2。據悉,V2將對RISC-V指令集架構進行增強,使其能與x86和ARM同台競技。
目前來看,Imagination與Ventana的合作項目距離產品量產和規模化應用還有較大距離,但是,RISC-V CPU和GPU IP融合的可用性,可能會帶來針對不同客戶端應用的新一波RISC-V平台开發熱潮。
從目前的市場和應用需求來看,RISC-V與GPU的結合是有基礎的。
在一些垂直市場,例如5G/6G通信、AI推理和視頻處理等,傳統CPU已經無法滿足這些應用的計算量需求,需要新計算方法的出現。對於圖像處理來說,內存訪問瓶頸問題已經非常凸出,需要新的解決方案,甚至是新的計算架構,看看市場上最近發布的一些人工智能和RISC-V產品,會發現一些公司發布的處理器裏面有新的ISA,它們已經开始將RISC-V和GPU IP融合使用了。
通過指令擴展將GPU功能添加到RISC-V架構中很有創意,然而,二者融合這條路並不好走,最大的攔路虎就是架構融合,以及生態系統建設,需要的時間可能很長。要將RISC-V指令集改編成非常適合GPU任務的指令集,需要大量投資來定義ISA擴展,構建高度復雜的微架構,並對开源工具進行重大調整。如果將RISC-V指令集融入GPU架構,幾乎所有RISC-V的固有優勢都將被定制化稀釋掉,另外,RISC-V核心ISA功能會限制GPU在特定領域的可用性。
雖然,有諸多挑战,但鑑於RISC-V迅猛的發展勢頭,以及其在高性能計算領域的滲透決心,與同樣在高性能計算應用領域如魚得水的GPU融合,前景還是很值得期待的。
不僅是國際巨頭,中國本土GPU廠商,特別是更具前瞻性的幾家創業公司,在發展GPU方面也需要研發更具競爭力的技術和產品,而在當下美國政府推出各種限制政策的大環境下,中國本土GPU芯片技術和生態系統建設可以拓展更多思路,將更多先進的技術和理念融入相關產品。在本土企業客戶給出更多採用和試錯空間的情況下,中國芯片企業或許可以加快追趕國際先進GPU的步伐。
標題:GPU芯片新技術出現,中國廠商值得借鑑
地址:https://www.utechfun.com/post/289582.html