大模型價格战,打到了負毛利

2024-09-24 18:10:08    編輯: robot
導讀   國產大模型淘汰賽在加速。這輪淘汰賽會持續一兩年,只有少數真正具備實力的基礎模型企業能繼續活下去   文 | 《財經》特約撰稿人 吳俊宇   編輯 | 謝麗容   中國市場的大模型價格战已經打了近...

  國產大模型淘汰賽在加速。這輪淘汰賽會持續一兩年,只有少數真正具備實力的基礎模型企業能繼續活下去

  文 | 《財經》特約撰稿人 吳俊宇

  編輯 | 謝麗容

  中國市場的大模型價格战已經打了近半年。這輪價格战已經打到了負毛利,而且暫時沒有停止跡象。頭部雲廠商仍在酝釀新一輪降價。這輪降價會在今年9月下旬落地。

  今年5月,中國雲廠商开始大模型推理算力價格战。字節跳動旗下雲服務火山引擎、阿裏雲、百度智能雲、騰訊雲先後把大模型推理算力價格下降了90%以上。

  使用大模型要輸入提示語言,經過推理得到內容輸出。這個過程會調用API(應用程序編程接口,就像水電开關),按消耗Token(Token是大模型的文本單位,一個Token可以是單詞、標點、數字、符號等)數量付費。這就像爲水電按使用量繳費。

  降價後,推理算力消耗量確在快速增長。今年8月,百度二季度財報電話會披露,百度文心大模型5月API日均調用次數是2億,8月增長到了到6億次;5月日均Token消耗量是2500億,8月增長到了1萬億。字節跳動今年8月宣布,截至7月字節跳動豆包大模型日均Token用量超過5000億。相比5月,平均每家企業日均Token使用量增長了22倍。

  Token價格下降了90%以上。這在短期內會降低雲廠商的推理收入。但雲廠商期望通過這種方式降低企業客戶試錯門檻,形成10倍以上的指數級算力消耗,最終獲得長期收入增長。

  國內大模型市場的推理算力價格战持續半年,目前有三個基本事實:

  其一,推理算力價格战,已經打到了負毛利。近期,包括阿裏雲、百度智能雲在內的多位雲廠商負責人向我們透露,今年5月以前,國內大模型推理算力毛利率高於60%,和國際同行基本一致。今年5月各大廠接連降價後,推理算力毛利率跌至負數。

  其二,國內模型和OpenAI的同規格模型相比,價格普遍只有其20%-50%。國內大模型毛利率遠低於OpenAI。國際市場調研機構FutureSearch今年8月的研究報告稱,OpenAI旗下GPT-4系列旗艦模型毛利率約爲75%,GPT-4o系列主力模型毛利率約爲55%。OpenAI綜合毛利率至少超過40%。

  其三,模型能力不足是價格战的重要成因。一位雲廠商大模型業務核心負責人認爲,目前國內的旗艦模型能力普遍和OpenAI的GPT-4系列旗艦模型存在差距,所以要通過降價鼓勵客戶試錯。隨着模型價格持續下降,價格已不再是企業客戶最關注的因素。模型的能力、效果,才是企業客戶最關心的。

  不得不打的價格战

  我們查閱了阿裏雲、火山引擎、百度智能雲、騰訊雲以及OpenAI官網公布的大模型推理價格。國內模型和OpenAI的同規格模型相比,價格普遍只有20%-50%。

  以阿裏的通義千問-Max、百度的ERNIE-4.0-8K、騰訊的hunyuan-pro三款旗艦模型爲例,三者每百萬Tokens的輸出價格分別是120元、120元、100元。它們對標的OpenAI旗艦模型GPT-4-turbo每百萬Tokens輸出價格是210元(OpenAI官網標價是30美元,此處已按美元和人民幣匯率1:7換算)。這三款國產大模型的價格僅爲GPT-4-turbo的50%左右。   

  以阿裏的Qwen-Long、百度的ERNIE-Speed-Pro-128K、騰訊的hunyuan-embedding三款入門模型爲例,三者每百萬Tokens的輸出價格分別是2元、0.8元、5元。OpenAI的廉價模型OpenAI gpt-4o-mini百萬Tokens輸出價格是4.2元(OpenAI官網標價是0.6美元,此處已按美元和人民幣匯率1:7換算)。阿裏和百度的入門模型僅爲OpenAI入門模型價格的48%和19%。

  大模型價格战已經打到了負毛利,但這並未止住各個雲廠商繼續降價的步伐。

  我們得到的消息是,阿裏雲等頭部雲廠商仍在酝釀新一輪降價。這輪降價會在今年9月下旬落地。高性能的旗艦模型是這輪降價重點。

  上述雲廠商大模型業務核心負責人認爲,廉價小尺寸模型目前降價空間不大,上輪降價已降到了企業客戶的“心理底线”。下一步的關注重點是,各家旗艦模型是否會繼續降價。旗艦模型也會進一步細分,分化出能解決大部分問題的高性價比版本,以及解決超難問題的高質量、高價格版本。

  大模型推理算力到了負毛利,爲何還要持續降價?

  大型雲廠看長期市場大勢——雲計算的算力結構正在劇變。搶佔更多推理算力,就是搶佔更多增量市場。國際市場調研機構IDC預測,2022年-2027年中國通用算力年復合增速16.6%,智能算力年復合增速33.9%。2022年-2027年,智能算力內部,推理算力佔比將上升到72.6%,訓練算力佔比會下滑到27.4%。

  雲廠商愿意爲了預期中的長期增長放棄短期收入。在短期內,推理算力能帶來的收入並不多。一位中國雲廠商技術人士解釋,2024年各家模型調用收入不會超過10億元,這在每年數百億營收的大盤中規模有限。雲廠商愿意在未來1年-2年接受短期收入損失和業務虧損。大家賭的是,未來1年-2年大模型調用次數至少有10倍以上的指數級增長。最終,長期收入增長能彌補短期收入損失。

  他進一步解釋,這個過程中,算力成本會隨着客戶需求增長逐漸攤薄。大模型業務最終仍有機會實現正向利潤。即使賭局不成立,也會有一批模型廠商死於價格战,活下去的廠商會收拾殘局。

  不同雲廠商面對價格战,也有不同的競爭考量——火山引擎、阿裏雲、百度智能雲都在參與一場必須要打的價格战。   

  火山引擎目前在中國公共雲市場份額未進入前五,但2023年火山引擎營收增速超過150%。大模型是它在雲市場彎道追趕的重要機會。火山引擎總裁譚待今年5月向我們提到,今年3月他在硅谷發現,美國AI應用創業呈現了2012年-2014年中國移動互聯網初期的趨勢。“AI應用創業小團隊,很快取得營收和融資。中國市場未來可能會呈現這種趨勢。但前提是,推理價格要降低,試錯門檻要降低。”

  阿裏雲在中國公共雲市場位居第一。面對對手降價,阿裏雲必須跟進。阿裏雲公共雲事業部總經理劉偉光今年6月曾向我們分析,阿裏雲內部經歷了多輪推演和測算,發現兩個矛盾點:

  • 一是,降價後存量收入會下降,增量收入會增長。理想情況是,增量收入能覆蓋存量收入。

  • 二是,如果同行降價更激進,要如何應對。最終結論是,現在的規模比利潤更重要。阿裏雲要用大模型提高全行業的雲計算滲透率。

  百度智能雲把AI作爲核心战略。一位百度大模型技術負責人今年7月對我們直言,大模型是必打之仗,價格战咬牙也得打。這一战略取得了實際成效。百度智能雲2024年二季度的營收增速已回升至14%,是近兩年的最高點。百度管理層在2024年二季度財報電話會中披露,百度智能雲的大模型收入佔比已從2023年四季度的4.8%提升到了2024年二季度的9%。

  一位中國頭部科技企業的AI战略規劃人士分析,火山引擎背靠字節跳動,母公司的廣告業務可以輸血。火山引擎在雲市場份額未進前五,希望通過價格战搶佔更多市場份額。阿裏雲主要來自公共雲四大件(計算、存儲、網絡、數據庫),低價模型會促進客戶業務數據消耗,進而帶動上述基礎雲產品的銷售。大模型是百度的核心战略,百度在國內最早布局大模型業務,當其他對手決定價格战時,百度必須跟進。

  價格不是決定因素

  大模型推理價格战負毛利的另一面是,低價並不是企業客戶是否使用大模型的主要因素。

  前述雲廠商大模型業務核心負責人認爲,雲廠商不能指望靠長期燒錢虧損推動大模型產業落地。低性能、低價格的模型意義不大。模型能力不足,才是負毛利價格战的重要原因。隨着國內模型調用價格大幅下降,價格不再是企業客戶最關注的因素。模型的能力、效果,才是企業客戶最關心的。

  一位保險公司的IT負責人對此認同。他直言,目前金融保險行業IT支出在公司營收中的佔比約爲3%-5%,刨除80%的硬件IT支出,真正用於數字化轉型的IT支出只有20%。使用大模型這種新技術必須算清投入產出比。除了顯性的模型成本,還要考慮隱性成本——大模型要與現有IT系統兼容,爲大模型准備業務數據需要進行數據治理,還要招聘一批懂AI的產品經理。他最關注的是,模型能力和實際效果。

  斯坦福大學基礎模型研究中心(CRFM)長期進行全球大模型測試排名。截至9月17日的大規模多任務語言理解 (MMLU)測試排名顯示,排名前十的模型廠商包括AI創業公司Anthropic(亞馬遜投資)旗下的Claude 3.5系列、Meta旗下的Llama3.1系列、OpenAI(微軟投資)旗下的GPT-4系列、谷歌旗下的Gemini 1.5系列。中國大模型目前僅有阿裏旗下的通義千問2 Instruct (72B)進入了前十。

  多位中國雲廠商大模型技術人士對《財經》表達了同一個觀點:大模型市場,低性能、低價格的策略不可持續。理想情況是,依靠高性能和合理的價格建立健康持久的商業閉環。

  比較有參考價值的標杆是OpenAI。截至今年9月,OpenAI擁有10億月活躍用戶、1100萬付費用戶(其中包括1000萬付費個人訂閱用戶和100萬企業訂閱用戶)。今年5月,OpenAI管理層宣布,公司年化收入(年化收入爲當月收入×12,訂閱制軟件公司每月會收到用戶訂閱續費,有穩定的收入預期,因此常採用年化收入口徑)達到了34億美元(按美元和人民幣匯率1:7換算,約合241億元)。

  國際市場調研機構FutureSearch最新研究報告根據OpenAI公布的年化收入、付費用戶結構測算了這家公司的收入結構——1000萬個人訂閱用戶帶來了19億美元收入,佔比56%;100萬企業訂閱用戶帶來了7.1億美元收入,佔比21%;API調用帶來了5.1億美元收入,佔比15%。

  即使經過多輪降價之後,OpenAI依舊能保持相對健康的毛利率。今年4月,OpenAI的旗艦模型GPT-4-turbo輸出價格降低了67%。今年8月,OpenAI的主力模型GPT-4o輸出價格降低了30%。FutureSearch今年8月發布的研究報告稱,OpenAI旗下GPT-4系列旗艦模型毛利率約爲75%,GPT-4o系列主力模型毛利率約爲55%。OpenAI綜合毛利率至少在40%以上。

  OpenAI的成長環境得天獨厚。它既擁有充足的算力供應,又有龐大的To C(面向消費者客戶)用戶,還身處全球最大的To B(面向企業客戶)軟件市場。

  OpenAI過去兩年的成功經驗是,靠大算力“暴力出奇跡”。中國企業缺少OpenAI這樣的算力條件和融資環境。算力是中國模型廠商的關鍵短板。

  一位中國雲廠商的模型技術人士解釋,過去一年多,中國雲廠商爲英偉達的AI芯片付出了1.5倍以上的採購成本,這使得模型算力成本居高不下。這會影響大模型的性能上限,也阻礙大模型的產業落地。一位服務器經銷商介紹,2023年中國市場搭載英偉達H100/H800系列AI芯片的八卡服務器一度超過300萬元/台,是英偉達官方定價的1.5倍以上。

  中國企業在算力資源受限、算力成本高昂的情況下,如何找到適合自己的發展路徑?這需要精打細算、量體裁衣。

  過去兩年,大模型的發展遵循着Scaling Law(OpenAI在2020年提出的定律,直譯爲“縮放定律”)——模型性能主要與計算量、模型參數量和訓練數據量三者大小相關。

  上述雲廠商大模型業務核心負責人提到,核心原則是在Scaling Law的約束下提升數據質量、數量,適當降低模型參數,還可以採用MoE(Mixture of Experts,一種模型設計策略,通過混合多個專業模型,獲得更好性能)架構提升模型性能、降低推理成本。落地到具體的業務策略,有兩種方案。

  • 其一,通過增加數據質量/數量、優化算法和架構的方式提升模型性能、降低模型尺寸。這可以有效減少算力消耗,還能提升主要應用效果,適應主流市場需求。

  • 其二,採取更精准、細分的模型產品策略。不指望靠少數幾款模型解決所有問題,而是讓不同模型解決不同問題。比如,讓性價比模型切經濟市場,讓高質量模型切高端市場。

  OpenAI今年三款模型GPT-4、GPT-4Turbo、GPT-4o就是沿着這種思路發展演進的。GPT-4o的模型參數比GPT-4更小,但可以精准解決大部分日常問題。GPT-4 Turbo被用於解決更多困難的問題。OpenAI最新的o1-preview性能最強,它經過了強化學習,甚至不再是單一模型,會在輸出回答前會反復思考,以此增強模型能力。這三款模型百萬Tokens的輸出價格分別是,70元、210元、420元(OpenAI官網標價爲10美元、30美元、60美元,此處已按美元和人民幣匯率1:7換算)。

  淘汰賽加速

  負毛利的價格战,正在加速大模型市場的淘汰賽。多位行業人士對《財經》表達了同一個觀點,這輪淘汰賽會持續一兩年,只有3家-5家基礎模型企業能繼續活下去。

  中國信息化百人會執委、阿裏雲智能科技研究中心主任安筱鵬今年7月曾對《財經》表示,大模型需要持續投資,要有萬卡甚至十萬卡的能力,還需要商業回報。很多企業不具備這樣的能力。未來中國市場只會有三五家基礎模型廠商。

  發展大模型需要採購芯片和服務器,租賃土地建設數據中心。這部分投入每年甚至高達百億元。這些成本會體現在科技公司的資本支出中。微軟2024財年四季度財報電話會披露,當月190億美元資本支出幾乎全部用於算力投入。近一年(2023年三季度-2024年二季度),阿裏、騰訊、百度的資本支出分別高達232億元、231億元、113億元,分別增長了77.1%、154.1%、46.9%,均是算力投資帶動的結果。

  除了百億元級別的持續算力投入,大模型推理業務每年還要十億元級別的補貼。一位中國雲廠商高管分析,大模型調用負毛利意味着,短期內調用次數越多,虧損就越大。按照目前的推理算力用量,幾家參與價格战的頭部雲廠商2024年要爲大模型推理算力消耗補貼超過十億元。

  阿裏雲、火山引擎、百度智能雲、騰訊雲可以靠集團輸血大模型打價格战,但大模型創業公司很難堅持下去。上述中國頭部科技企業的AI战略規劃人士認爲,這輪價格战中,阿裏雲、火山引擎的血最厚。阿裏能靠雲盈利,火山引擎有字節跳動的廣告業務輸血。打價格战,百度不如阿裏、字節跳動。但百度的文心大模型技術強,會有一批愿意爲技術付費的客戶。這對百度扛住價格战有幫助。

  大模型創業公司,短期內要靠大廠和融資才能存活。一位大模型創業公司技術人士今年9月對《財經》表示,智譜AI、百川智能、月之暗面、零一萬物和Minimax,國內大模型“五小虎”全部都是阿裏投資的。其中一種投資方式是,投資額以算力形式支付,被投企業使用阿裏雲的算力。“五小虎”能否持續生存,一定程度上取決於阿裏是否要繼續投入。

  上述頭部雲廠商技術人士和上述大模型創業公司技術人士同時認爲,中國市場的大模型創業公司未來兩年會面臨考驗,它們在基礎模型市場很難突圍,未來可能有三條出路——要么選擇成爲政企項目模型开發公司,要么轉向To B的垂直行業模型,要么轉向To C的應用市場。事實上,市場分化已經开始了。智譜AI正在大量中標政企項目,月之暗面則只專注於To C市場。

海量資訊、精准解讀,盡在新浪財經APP

責任編輯:劉萬裏 SF014



標題:大模型價格战,打到了負毛利

地址:https://www.utechfun.com/post/424607.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡