大模型價格战，打到了負毛利

2024-09-24 18:10:08 編輯： robot

導讀　　國產大模型淘汰賽在加速。這輪淘汰賽會持續一兩年，只有少數真正具備實力的基礎模型企業能繼續活下去　　文 | 《財經》特約撰稿人吳俊宇　　編輯 | 謝麗容　　中國市場的大模型價格战已經打了近...

　　國產大模型淘汰賽在加速。這輪淘汰賽會持續一兩年，只有少數真正具備實力的基礎模型企業能繼續活下去

　　文 | 《財經》特約撰稿人吳俊宇

　　編輯 | 謝麗容

　　中國市場的大模型價格战已經打了近半年。這輪價格战已經打到了負毛利，而且暫時沒有停止跡象。頭部雲廠商仍在酝釀新一輪降價。這輪降價會在今年9月下旬落地。

　　今年5月，中國雲廠商开始大模型推理算力價格战。字節跳動旗下雲服務火山引擎、阿裏雲、百度智能雲、騰訊雲先後把大模型推理算力價格下降了90%以上。

　　使用大模型要輸入提示語言，經過推理得到內容輸出。這個過程會調用API（應用程序編程接口，就像水電开關），按消耗Token（Token是大模型的文本單位，一個Token可以是單詞、標點、數字、符號等）數量付費。這就像爲水電按使用量繳費。

　　降價後，推理算力消耗量確在快速增長。今年8月，百度二季度財報電話會披露，百度文心大模型5月API日均調用次數是2億，8月增長到了到6億次；5月日均Token消耗量是2500億，8月增長到了1萬億。字節跳動今年8月宣布，截至7月字節跳動豆包大模型日均Token用量超過5000億。相比5月，平均每家企業日均Token使用量增長了22倍。

　　Token價格下降了90%以上。這在短期內會降低雲廠商的推理收入。但雲廠商期望通過這種方式降低企業客戶試錯門檻，形成10倍以上的指數級算力消耗，最終獲得長期收入增長。

　　國內大模型市場的推理算力價格战持續半年，目前有三個基本事實：

　　其一，推理算力價格战，已經打到了負毛利。近期，包括阿裏雲、百度智能雲在內的多位雲廠商負責人向我們透露，今年5月以前，國內大模型推理算力毛利率高於60%，和國際同行基本一致。今年5月各大廠接連降價後，推理算力毛利率跌至負數。

　　其二，國內模型和OpenAI的同規格模型相比，價格普遍只有其20%-50%。國內大模型毛利率遠低於OpenAI。國際市場調研機構FutureSearch今年8月的研究報告稱，OpenAI旗下GPT-4系列旗艦模型毛利率約爲75%，GPT-4o系列主力模型毛利率約爲55%。OpenAI綜合毛利率至少超過40%。

　　其三，模型能力不足是價格战的重要成因。一位雲廠商大模型業務核心負責人認爲，目前國內的旗艦模型能力普遍和OpenAI的GPT-4系列旗艦模型存在差距，所以要通過降價鼓勵客戶試錯。隨着模型價格持續下降，價格已不再是企業客戶最關注的因素。模型的能力、效果，才是企業客戶最關心的。

　　不得不打的價格战

　　我們查閱了阿裏雲、火山引擎、百度智能雲、騰訊雲以及OpenAI官網公布的大模型推理價格。國內模型和OpenAI的同規格模型相比，價格普遍只有20%-50%。

　　以阿裏的通義千問-Max、百度的ERNIE-4.0-8K、騰訊的hunyuan-pro三款旗艦模型爲例，三者每百萬Tokens的輸出價格分別是120元、120元、100元。它們對標的OpenAI旗艦模型GPT-4-turbo每百萬Tokens輸出價格是210元（OpenAI官網標價是30美元，此處已按美元和人民幣匯率1：7換算）。這三款國產大模型的價格僅爲GPT-4-turbo的50%左右。

　　以阿裏的Qwen-Long、百度的ERNIE-Speed-Pro-128K、騰訊的hunyuan-embedding三款入門模型爲例，三者每百萬Tokens的輸出價格分別是2元、0.8元、5元。OpenAI的廉價模型OpenAI gpt-4o-mini百萬Tokens輸出價格是4.2元（OpenAI官網標價是0.6美元，此處已按美元和人民幣匯率1：7換算）。阿裏和百度的入門模型僅爲OpenAI入門模型價格的48%和19%。

　　大模型價格战已經打到了負毛利，但這並未止住各個雲廠商繼續降價的步伐。

　　我們得到的消息是，阿裏雲等頭部雲廠商仍在酝釀新一輪降價。這輪降價會在今年9月下旬落地。高性能的旗艦模型是這輪降價重點。

　　上述雲廠商大模型業務核心負責人認爲，廉價小尺寸模型目前降價空間不大，上輪降價已降到了企業客戶的“心理底线”。下一步的關注重點是，各家旗艦模型是否會繼續降價。旗艦模型也會進一步細分，分化出能解決大部分問題的高性價比版本，以及解決超難問題的高質量、高價格版本。

　　大模型推理算力到了負毛利，爲何還要持續降價？

　　大型雲廠看長期市場大勢——雲計算的算力結構正在劇變。搶佔更多推理算力，就是搶佔更多增量市場。國際市場調研機構IDC預測，2022年-2027年中國通用算力年復合增速16.6%，智能算力年復合增速33.9%。2022年-2027年，智能算力內部，推理算力佔比將上升到72.6%，訓練算力佔比會下滑到27.4%。

　　雲廠商愿意爲了預期中的長期增長放棄短期收入。在短期內，推理算力能帶來的收入並不多。一位中國雲廠商技術人士解釋，2024年各家模型調用收入不會超過10億元，這在每年數百億營收的大盤中規模有限。雲廠商愿意在未來1年-2年接受短期收入損失和業務虧損。大家賭的是，未來1年-2年大模型調用次數至少有10倍以上的指數級增長。最終，長期收入增長能彌補短期收入損失。

　　他進一步解釋，這個過程中，算力成本會隨着客戶需求增長逐漸攤薄。大模型業務最終仍有機會實現正向利潤。即使賭局不成立，也會有一批模型廠商死於價格战，活下去的廠商會收拾殘局。

　　不同雲廠商面對價格战，也有不同的競爭考量——火山引擎、阿裏雲、百度智能雲都在參與一場必須要打的價格战。

　　火山引擎目前在中國公共雲市場份額未進入前五，但2023年火山引擎營收增速超過150%。大模型是它在雲市場彎道追趕的重要機會。火山引擎總裁譚待今年5月向我們提到，今年3月他在硅谷發現，美國AI應用創業呈現了2012年-2014年中國移動互聯網初期的趨勢。“AI應用創業小團隊，很快取得營收和融資。中國市場未來可能會呈現這種趨勢。但前提是，推理價格要降低，試錯門檻要降低。”

　　阿裏雲在中國公共雲市場位居第一。面對對手降價，阿裏雲必須跟進。阿裏雲公共雲事業部總經理劉偉光今年6月曾向我們分析，阿裏雲內部經歷了多輪推演和測算，發現兩個矛盾點：

一是，降價後存量收入會下降，增量收入會增長。理想情況是，增量收入能覆蓋存量收入。
二是，如果同行降價更激進，要如何應對。最終結論是，現在的規模比利潤更重要。阿裏雲要用大模型提高全行業的雲計算滲透率。

　　百度智能雲把AI作爲核心战略。一位百度大模型技術負責人今年7月對我們直言，大模型是必打之仗，價格战咬牙也得打。這一战略取得了實際成效。百度智能雲2024年二季度的營收增速已回升至14%，是近兩年的最高點。百度管理層在2024年二季度財報電話會中披露，百度智能雲的大模型收入佔比已從2023年四季度的4.8%提升到了2024年二季度的9%。

　　一位中國頭部科技企業的AI战略規劃人士分析，火山引擎背靠字節跳動，母公司的廣告業務可以輸血。火山引擎在雲市場份額未進前五，希望通過價格战搶佔更多市場份額。阿裏雲主要來自公共雲四大件（計算、存儲、網絡、數據庫），低價模型會促進客戶業務數據消耗，進而帶動上述基礎雲產品的銷售。大模型是百度的核心战略，百度在國內最早布局大模型業務，當其他對手決定價格战時，百度必須跟進。

　　價格不是決定因素

　　大模型推理價格战負毛利的另一面是，低價並不是企業客戶是否使用大模型的主要因素。

　　前述雲廠商大模型業務核心負責人認爲，雲廠商不能指望靠長期燒錢虧損推動大模型產業落地。低性能、低價格的模型意義不大。模型能力不足，才是負毛利價格战的重要原因。隨着國內模型調用價格大幅下降，價格不再是企業客戶最關注的因素。模型的能力、效果，才是企業客戶最關心的。

　　一位保險公司的IT負責人對此認同。他直言，目前金融保險行業IT支出在公司營收中的佔比約爲3%-5%，刨除80%的硬件IT支出，真正用於數字化轉型的IT支出只有20%。使用大模型這種新技術必須算清投入產出比。除了顯性的模型成本，還要考慮隱性成本——大模型要與現有IT系統兼容，爲大模型准備業務數據需要進行數據治理，還要招聘一批懂AI的產品經理。他最關注的是，模型能力和實際效果。

　　斯坦福大學基礎模型研究中心（CRFM）長期進行全球大模型測試排名。截至9月17日的大規模多任務語言理解（MMLU）測試排名顯示，排名前十的模型廠商包括AI創業公司Anthropic（亞馬遜投資）旗下的Claude 3.5系列、Meta旗下的Llama3.1系列、OpenAI（微軟投資）旗下的GPT-4系列、谷歌旗下的Gemini 1.5系列。中國大模型目前僅有阿裏旗下的通義千問2 Instruct （72B）進入了前十。

　　多位中國雲廠商大模型技術人士對《財經》表達了同一個觀點：大模型市場，低性能、低價格的策略不可持續。理想情況是，依靠高性能和合理的價格建立健康持久的商業閉環。

　　比較有參考價值的標杆是OpenAI。截至今年9月，OpenAI擁有10億月活躍用戶、1100萬付費用戶（其中包括1000萬付費個人訂閱用戶和100萬企業訂閱用戶）。今年5月，OpenAI管理層宣布，公司年化收入（年化收入爲當月收入×12，訂閱制軟件公司每月會收到用戶訂閱續費，有穩定的收入預期，因此常採用年化收入口徑）達到了34億美元（按美元和人民幣匯率1：7換算，約合241億元）。

　　國際市場調研機構FutureSearch最新研究報告根據OpenAI公布的年化收入、付費用戶結構測算了這家公司的收入結構——1000萬個人訂閱用戶帶來了19億美元收入，佔比56%；100萬企業訂閱用戶帶來了7.1億美元收入，佔比21%；API調用帶來了5.1億美元收入，佔比15%。

　　即使經過多輪降價之後，OpenAI依舊能保持相對健康的毛利率。今年4月，OpenAI的旗艦模型GPT-4-turbo輸出價格降低了67%。今年8月，OpenAI的主力模型GPT-4o輸出價格降低了30%。FutureSearch今年8月發布的研究報告稱，OpenAI旗下GPT-4系列旗艦模型毛利率約爲75%，GPT-4o系列主力模型毛利率約爲55%。OpenAI綜合毛利率至少在40%以上。

　　OpenAI的成長環境得天獨厚。它既擁有充足的算力供應，又有龐大的To C（面向消費者客戶）用戶，還身處全球最大的To B（面向企業客戶）軟件市場。

　　OpenAI過去兩年的成功經驗是，靠大算力“暴力出奇跡”。中國企業缺少OpenAI這樣的算力條件和融資環境。算力是中國模型廠商的關鍵短板。

　　一位中國雲廠商的模型技術人士解釋，過去一年多，中國雲廠商爲英偉達的AI芯片付出了1.5倍以上的採購成本，這使得模型算力成本居高不下。這會影響大模型的性能上限，也阻礙大模型的產業落地。一位服務器經銷商介紹，2023年中國市場搭載英偉達H100/H800系列AI芯片的八卡服務器一度超過300萬元/台，是英偉達官方定價的1.5倍以上。

　　中國企業在算力資源受限、算力成本高昂的情況下，如何找到適合自己的發展路徑？這需要精打細算、量體裁衣。

　　過去兩年，大模型的發展遵循着Scaling Law（OpenAI在2020年提出的定律，直譯爲“縮放定律”）——模型性能主要與計算量、模型參數量和訓練數據量三者大小相關。

　　上述雲廠商大模型業務核心負責人提到，核心原則是在Scaling Law的約束下提升數據質量、數量，適當降低模型參數，還可以採用MoE（Mixture of Experts，一種模型設計策略，通過混合多個專業模型，獲得更好性能）架構提升模型性能、降低推理成本。落地到具體的業務策略，有兩種方案。

其一，通過增加數據質量/數量、優化算法和架構的方式提升模型性能、降低模型尺寸。這可以有效減少算力消耗，還能提升主要應用效果，適應主流市場需求。
其二，採取更精准、細分的模型產品策略。不指望靠少數幾款模型解決所有問題，而是讓不同模型解決不同問題。比如，讓性價比模型切經濟市場，讓高質量模型切高端市場。

　　OpenAI今年三款模型GPT-4、GPT-4Turbo、GPT-4o就是沿着這種思路發展演進的。GPT-4o的模型參數比GPT-4更小，但可以精准解決大部分日常問題。GPT-4 Turbo被用於解決更多困難的問題。OpenAI最新的o1-preview性能最強，它經過了強化學習，甚至不再是單一模型，會在輸出回答前會反復思考，以此增強模型能力。這三款模型百萬Tokens的輸出價格分別是，70元、210元、420元（OpenAI官網標價爲10美元、30美元、60美元，此處已按美元和人民幣匯率1：7換算）。

　　淘汰賽加速

　　負毛利的價格战，正在加速大模型市場的淘汰賽。多位行業人士對《財經》表達了同一個觀點，這輪淘汰賽會持續一兩年，只有3家-5家基礎模型企業能繼續活下去。

　　中國信息化百人會執委、阿裏雲智能科技研究中心主任安筱鵬今年7月曾對《財經》表示，大模型需要持續投資，要有萬卡甚至十萬卡的能力，還需要商業回報。很多企業不具備這樣的能力。未來中國市場只會有三五家基礎模型廠商。

　　發展大模型需要採購芯片和服務器，租賃土地建設數據中心。這部分投入每年甚至高達百億元。這些成本會體現在科技公司的資本支出中。微軟2024財年四季度財報電話會披露，當月190億美元資本支出幾乎全部用於算力投入。近一年（2023年三季度-2024年二季度），阿裏、騰訊、百度的資本支出分別高達232億元、231億元、113億元，分別增長了77.1%、154.1%、46.9%，均是算力投資帶動的結果。

　　除了百億元級別的持續算力投入，大模型推理業務每年還要十億元級別的補貼。一位中國雲廠商高管分析，大模型調用負毛利意味着，短期內調用次數越多，虧損就越大。按照目前的推理算力用量，幾家參與價格战的頭部雲廠商2024年要爲大模型推理算力消耗補貼超過十億元。

　　阿裏雲、火山引擎、百度智能雲、騰訊雲可以靠集團輸血大模型打價格战，但大模型創業公司很難堅持下去。上述中國頭部科技企業的AI战略規劃人士認爲，這輪價格战中，阿裏雲、火山引擎的血最厚。阿裏能靠雲盈利，火山引擎有字節跳動的廣告業務輸血。打價格战，百度不如阿裏、字節跳動。但百度的文心大模型技術強，會有一批愿意爲技術付費的客戶。這對百度扛住價格战有幫助。

　　大模型創業公司，短期內要靠大廠和融資才能存活。一位大模型創業公司技術人士今年9月對《財經》表示，智譜AI、百川智能、月之暗面、零一萬物和Minimax，國內大模型“五小虎”全部都是阿裏投資的。其中一種投資方式是，投資額以算力形式支付，被投企業使用阿裏雲的算力。“五小虎”能否持續生存，一定程度上取決於阿裏是否要繼續投入。

　　上述頭部雲廠商技術人士和上述大模型創業公司技術人士同時認爲，中國市場的大模型創業公司未來兩年會面臨考驗，它們在基礎模型市場很難突圍，未來可能有三條出路——要么選擇成爲政企項目模型开發公司，要么轉向To B的垂直行業模型，要么轉向To C的應用市場。事實上，市場分化已經开始了。智譜AI正在大量中標政企項目，月之暗面則只專注於To C市場。

海量資訊、精准解讀，盡在新浪財經APP

責任編輯：劉萬裏 SF014

標題：大模型價格战，打到了負毛利

地址：https://www.utechfun.com/post/424607.html

鄭重聲明：本文版權歸原作者所有，轉載文章僅為傳播信息之目的，不構成任何投資建議，如有侵權行為，請第一時間聯絡我們修改或刪除，多謝。

標籤：大模型進展毛利率 AI 價格战 Tok 推理百度

上一篇:美國發出全球通緝，逮捕助華爲突破5G的芯片大佬，他現在怎樣了?

下一篇:華爲鴻蒙系統成功移除“美國代碼”，純血鴻蒙終於問世！爲中國科技點贊！

您現在的位置：首頁智能設備

大模型價格战，打到了負毛利

猜你喜歡

您現在的位置： 首頁 智能設備

猜你喜歡

您現在的位置：首頁智能設備