未來的大模型,或許都是A卡來算的?

2024-10-21 18:40:37    編輯: robot
導讀 前言: 當前,算力中心領域正面臨一個重要趨勢,即隨着部分大型模型制造商逐漸減少對預訓練的依賴,對推理能力和模型微調的需求顯著增加。 這一變化對下遊大型模型和應用开發商產生了深遠影響,進而促使上遊芯片...

前言:

當前,算力中心領域正面臨一個重要趨勢,即隨着部分大型模型制造商逐漸減少對預訓練的依賴,對推理能力和模型微調的需求顯著增加。

這一變化對下遊大型模型和應用开發商產生了深遠影響,進而促使上遊芯片制造商迅速調整战略方向。

然而,僅僅依靠單一芯片的差異化競爭已難以滿足市場需求。

作者 | 方文三

圖片來源 |  網 絡 

AMD新品直接對標英偉達Blackwell系列芯片

AMD公司在舊金山舉辦的Advancing AI 2024盛會上,其首席執行官蘇姿豐推出了全新一代的Ryzen CPU、Instinct AI計算卡以及EPYC AI芯片等系列產品。

這些產品全面覆蓋了AI計算領域,並明確針對英偉達公司的Blackwell系列芯片展开競爭。

據國際媒體報道,過去幾年中,英偉達在數據中心GPU市場中佔據了顯著的領導地位,近乎形成壟斷態勢,而AMD則長期穩居市場份額的第二位。

今年初,英偉達又發布了其性能巔峰之作B200,其運算能力相較於上一代H200芯片實現了近30倍的提升。

根據規劃,B200將於今年第四季度實現量產並投放市場,預計將進一步拉大與競爭對手的差距。

然而,隨着MI325X的發布,AMD旨在與英偉達的Blackwell芯片展开有力競爭。

AMD在其Instinct MI325X GPU中集成了8個MI325X單元,該配置能夠支持最高達2TB的HBM3E內存;

其FP8精度下的理論峰值性能可達20.8 PFLOPs,而在FP16精度下則可達10.4 PFLOPs。

在系統架構方面,AMD採用了Infinity Fabric互連技術,實現了高達896 GB/s的帶寬,並且總內存帶寬達到了48 TB/s。

此外,每個GPU的功耗也從原先的750W提升至了1000W。

與英偉達H200 HGX相比,Instinct MI325X在內存量、內存帶寬及算力水平方面分別展現出1.8倍和1.3倍的優勢。

在推理性能上,其相較H200 HGX也實現了約1.4倍的提升。

在Meta Llama-2等主流模型中,MI325X的單GPU訓練效率已超越H200,但在集群環境中,兩者則保持相當水平。

此外,AMD還着重介紹了其下一代MI300系列GPU加速器——MI355X。

該型號基於下一代CDNA 4架構,並採用3nm制程工藝,其內存容量已升級至288GB HBM3E。

MI355X能夠同時支持FP4和FP6數據類型,從而在保持計算精度的同時,進一步提升AI訓練和推理性能。

AMD方面表示,下一代CDNA 4架構相較於CDNA 3架構,預計將有35倍的性能提升和7倍的AI算力提升,同時內存容量和帶寬也將提升約50%。

因此,明年的Instinct MI355X AI GPU在性能上預計將實現巨大飛躍。

根據AMD目前公布的數據,Instinct MI355X AI GPU在FP16數據格式下的算力可達到2.3PF,相較於MI325X提高了1.8倍,並與英偉達B200的算力持平。

而在FP6和FP4格式下,其算力則能達到9.2PF,較B200在FP6格式下的算力提高近一倍,與B200在FP4格式下的算力相當。

因此,MI355X被視爲AMD真正對標B200的GPU芯片。

Blackwell GPU的生產問題目前已解決

此前有報道稱,Blackwell架構產品的生產過程中遭遇了一些問題,具體表現爲良品率較低,進而影響了出貨量。

英偉達Blackwell GPU作爲首批採用台積電CoWoS-L封裝技術的產品,該技術通過LSI橋接器構建高密度互聯,能夠無縫兼容各類高性能芯片。

然而,由於GPU芯片、RDL中間層、LSI橋接器及基板之間的熱膨脹系數(CTE)存在差異,這在一定程度上給生產帶來了挑战。

摩根士丹利指出,英偉達Blackwell GPU在生產過程中出現的良率下降問題主要發生在後封裝階段,這進一步加劇了原本就緊張的CoWoS封裝及HBM3e內存的供應狀況。

不過,該機構認爲英偉達已內部解決了這些問題。

摩根士丹利預測,英偉達將在今年第四季度出貨最多45萬張Blackwell GPU,有望實現50億美元至100億美元的營收。

同時,該機構還表示,由於當前Blackwell GPU訂單已排滿至明年下半年,無法滿足的訂單將轉而推動Hopper GPU的需求增長。

英偉達Blackwell GPU的生產問題曾被視爲AMD公司的一個潛在機遇,然而,這一機遇並未如預期般兌現。

AMD的UDNA與英偉達CUDA競爭生態位

在ADVANCING AI 2024大會上,AMD進一步揭示了其AI芯片發展藍圖,宣布基於CDNA 4架構的MI350系列將於明年面世,而MI400系列則將採用更爲先進的CDNA架構。

然而,要撼動英偉達CUDA生態的領先地位,AMD仍面臨諸多挑战,需付出長期努力。

UDNA作爲AMD的一項長遠布局,其潛力尚需時間驗證。

AMD在擴大市場份額的過程中,面臨的主要挑战在於英偉達通過其CUDA平台在AI軟件开發領域構建了堅固的壁壘,吸引了大量开發人員並深度綁定了他們與英偉達的生態系統。

CUDA生態系統,作爲英偉達所獨有的並行計算平台與編程模型,現已確立爲AI領域及高性能計算任務中的基准標准。

AMD所面臨的挑战,不僅聚焦於硬件性能的提升,更在於構建一個能夠吸引开發人員與數據科學家關注的軟件生態系統。

爲此,AMD已加大對其ROCm(Radeon Open Compute)軟件堆棧的投資力度,並在近期活動中宣布,已成功將AMD Instinct MI300X加速器在廣泛應用的AI模型中的推理與訓練性能提升一倍。

此外,該公司還指出,已有超過百萬個模型能夠在AMD Instinct平台上無縫運行,這一數字是MI300X推出之初的三倍。

退出高端顯卡市場,專注AI市場

對於遊戲玩家群體,主流大廠針對英偉達產品的專屬優化策略展現出了難以抗拒的吸引力。

鑑於此,AMD目前暫時退出高端顯卡市場的舉措,被視爲一項更爲明智的商業抉擇。

值得注意的是,這並非AMD首次在高端市場向英偉達讓步。

回溯至2017至2019年間,AMD實際上已缺席高端顯卡領域,彼時Vega 64與Radeon VII相繼淡出市場,僅依賴RX580與RX590兩款產品在中低端市場維持競爭力。

AMD當前的战略重心聚焦於中低端市場,旨在擴大用戶基礎,並通過龐大的用戶群體引導开發者優化產品。

此外,AMD的战略性撤退或可視爲其在AI領域[梭哈]的前奏。

鑑於AMD董事長兼首席執行官蘇姿豐博士對AI超級周期剛剛啓幕的堅定判斷,公司將AI視爲未來發展的關鍵方向,不惜重注投入。

面對AI芯片這一快速增長的市場,AMD無疑不愿錯失良機。

盡管其CPU業務因ZEN架構的成功而持續繁榮,但獨立顯卡、尤其是高端遊戲顯卡的市場表現卻難盡如人意。

因此,揚長避短、專注於AI產品的开發,成爲了AMD當前最合理的選擇。

盡管英偉達在AI訓練性能領域依然保持顯著優勢,但AI領域的真正盈利點在於推理工作負載。

簡而言之,訓練是通過數據集來[教育]AI模型的過程,而推理則是訓練後的模型對全新數據進行預測的過程。

但值得注意的是,AMD對其加速服務器產品的定價策略相當激進,這與淨利潤率超過50%的英偉達形成了鮮明對比。

這一策略與AMD在CPU市場上削弱英特爾地位所採用的方法如出一轍,鑑於性價比優勢,該策略或將促使部分客戶從英偉達轉向AMD。

AMD當下的首要目標是爭取更多的市場訂單

TechInsights公司的研究報告指出,英偉達在2023年的數據中心GPU出貨量達到了約376萬台,佔據了97.7%的市場份額,這一比例與2022年大致相當。

相比之下,AMD和英特爾分別以50萬台和40萬台的出貨量位列其後,市場份額分別佔據了1.3%和1%。

對於AMD而言,其當前的主要目標並非超越英偉達,而是積極爭取更多的市場訂單。

作爲英偉達在市場上的少數競爭對手之一,AMD始終被科技巨頭視爲多元化的選擇之一。

目前,AMD業務中AI芯片所佔比重持續攀升。

依據AMD二季度財務報告,AMD Instinct MI300X GPU在當季度爲AMD貢獻了超過10億美元的營業收入,並預計全年銷售額將突破45億美元大關,約佔公司整體銷售額的15%。

值得注意的是,包括微軟、OpenAI、Meta、Cohere、Stability AI、Lepton AI及World Labs在內的多家企業,在其生成式AI解決方案中均選用了AMD Instinct MI300X GPU。

除了獲得科技巨頭的支持外,AMD產品的性價比優勢也是其搶佔市場的重要因素。

英偉達由於其技術領先和市場高佔比,其產品溢價較高。

相比之下,AMD的MI300系列在性能上已經超越了英偉達的H100,且價格更爲親民。

這一性價比優勢使得AMD在AI芯片市場上具有較大的發展潛力。

基於以上分析,蘇姿豐對AMD在2024年的人工智能芯片收入預測進行了上調,預計將達到超過45億美元的水平,這一數字高於其4月份的預估值40億美元。

這進一步表明了AMD在AI芯片市場上的強勁增長勢頭和廣闊發展前景。

與英偉達相似,AMD亦規劃每年推出全新的AI芯片產品。

結尾:

對於AMD而言,雖然英偉達產能的恢復可能帶來競爭壓力,但幸運的是,AMD也已逐漸找到了適合自己的競爭節奏。

展望2025年,兩大芯片巨頭將在GPU領域再次正面交鋒,這將是檢驗雙方綜合實力的關鍵一年。

隨着技術的不斷進步和GPU在更多領域的廣泛應用,這兩家公司將持續優化GPU架構、提高計算效率,共同推動智能互聯時代的到來。

部分資料參考:潮外音:《AMD發布最強AI芯片,對標英偉達Blackwell,2025年上市》,至頂頭條:《AMD發力GPU計算領域,現在壓力來到英偉達這邊》,機器之心:《AMD的GPU跑AI模型終於Yes了?PK英偉達H100不帶怕的》,電子發燒友網:《AMD最強AI芯片,性能強過英偉達H200,但市場仍不买账,生態是最大短板?》,美股研究社:《AMD 即將奪得英偉達的 AI 領先地位》,報告財經:《OORT創始人:AMD在AI芯片市場對英偉達 的挑战》, NO 易摸:《AMD最強AI芯片登場,性能或徹底超越英偉達》,三易生活:《放棄高端顯卡市場,AMD或是選擇了[梭哈]AI》,賽博汽車:《挑战英偉達,AMD正成爲一家AI芯片公司》,大盛唐電子:《英偉達與AMD:GPU競爭的歷史與未來》

       原文標題 : AI芯天下丨分析丨未來的大模型,或許都是A卡來算的?



標題:未來的大模型,或許都是A卡來算的?

地址:https://www.utechfun.com/post/434981.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡