大模型“以釐計價”，誰能扛住價格战？

2024-05-27 18:40:32 編輯： robot

導讀最近一周，鋪天蓋地都是大模型降價的消息。字節降完，智譜降；阿裏降完，百度降；騰訊降完，科大訊飛降......是不是很像蹲蘿卜的遊戲？事實上，國內有頭有臉的大廠幾乎都加入了這場遊戲。接二連三地降價，...

最近一周，鋪天蓋地都是大模型降價的消息。字節降完，智譜降；阿裏降完，百度降；騰訊降完，科大訊飛降......是不是很像蹲蘿卜的遊戲？

事實上，國內有頭有臉的大廠幾乎都加入了這場遊戲。接二連三地降價，讓人一瞬間有了當年共享單車和雲計算價格战的感覺。

互聯網時代，所有人都習慣於大規模燒錢來獲得最後的勝利。但AI時代，這套玩法還行得通嗎？

國產大模型“以釐計價”

降價在商業世界裏並不難理解，無非是“降價促銷”、“以價換量”。

大模型領域的扛把子OpenAI就已經多次降價。

從去年3月OpenAI發布GPT4到現在，其產品從GPT4升級到GPT-4o，輸入價格從0.03美元/千tokens下降到0.005美元/千tokens，降幅爲83%；輸出價格從0.06美元/千tokens下降到0.015美元/千tokens，降幅爲75%。

但驚人的是，國內大模型比OpenAI更狠，直接把價格“打骨折”。

5月11日，智譜AI大模型的個人版GLM-3Turbo模型產品的調用價格從0.005元/千tokens降低至0.001元/千tokens，直降80%；GLM-3Turbo Batch 批處理API也便宜了50%，價格僅爲0.0005元/千tokens。

緊接着，5月15日，字節宣布豆包通用模型pro-32k版、pro-128k版在企業市場的推理輸入價格僅爲0.0008元/千tokens、0.005元/千tokens，較行業降幅達99.3%、95.8%，並聲稱已經擊穿了大模型行業的最底價。

但“價格屠夫”還在後面。5月21日，阿裏雲通義千問GPT-4級主力模型Qwen-Long的API輸入價格降至0.0005元/千tokens，直降97%。

各大廠動不動就降價90%以上，已經是硝煙四起，然而還有更狠的角色——百度直接宣布文心Speed和文心Lite兩款模型免費，开啓了大模型API調用的“免費時代”。

5月22日，騰訊也按耐不住了，宣布主力模型之一的混元-lite 模型不僅從4k升級到256k，而且全面免費。同日，科大訊飛首推永久免費大模型，訊飛星火API能力向全球用戶开放。有網友戲稱，大模型正從“以分計價”的定價模式向“以釐計價”的時代邁進。

價格战提前來臨？

其實大模型降價並不稀奇，但稀奇的是商業化還沒跑通，怎么價格战就先來了？

根據此前預期，大模型大致將按照每年50%-75%幅度降本，但現在大模型的降本速度遠超預期。

答案很簡單：加快商業化落地。

隨着大模型參數越來越大，研發成本也越來越高。在巨大的成本壓力下，大模型廠商不得不加緊尋找一條商業化之路。

根據無問芯穹發起人汪玉，用公开數據做了一次針對算力成本數量級的測算，假設GPT-4 Turbo每天要爲10億活躍用戶提供服務，每年的算力成本可能超過兩千億，這還不包括模型訓練的投入。

華爲大模型負責人田奇曾提到，大模型开發和訓練一次需要約1200萬美元，這表明即使技術再領先的公司，大模型的訓練也是非常昂貴的。

百川智能創始人CEO王小川也曾表示，每1億參數對應訓練成本在1.5到3萬人民幣之間。因此，一個千億級參數的模型單次訓練成本預估在3000萬至5000萬人民幣之間。

顯然，高昂的研發價格，已經成了AI商業化的枷鎖。絕大部分公司的收入仍然還在億的級別。以這種成本去打造商業閉環，顯然是不成立的，而降價就成了最直接且最快速的落地方式。

同時，價格战能掀起的另一個因素是，大模型技術已經卷得差不多了。

外賣、快遞、網約車、社區團購乃至新能源車等價格战火熱的行業，或多或少都是由於同質化競爭而導致的，大模型也可能是當前卷性能帶來的收益越來越低。

在《LLMs正達到收益遞減的證據——及其可能意味着什么》一文中，作者認爲大模型在性能提升方面可能已達到收益遞減的臨界點。以OpenAI爲例，從GPT-2到GPT-3、GPT-3到GPT-4都有巨大的飛躍，但GPT-4到GPT-4 Turbo就沒有那么多了。

如果大模型的性能發展真的要迎來一面牆，那么對於大模型公司來說，如何搶下用戶是現階段最重要的一步。

目前，國內大模型先頭部隊大多已接近GPT-4的能力，而這一能力已具備商業化的基礎。經過一年多的技術比拼，大模型顯然已經到了大規模市場驗證的階段。

因此，2024年大模型开始了從“卷技術”向“卷應用”的轉變，商業化、落地應用成爲大模型公司的主旋律，而降價將爲大模型的應用落地帶來了極大推動力。

誰能扛住價格战？

雖然大家都在價格上卷起來了，但並不是所有企業都能加入價格战。

降價涉及到大模型的研發、訓練、推理等一系列成本的優化，只有把大模型的研發成本盡可能的降低到最小，才有降價的空間和資本。

毋庸置疑，大廠是最扛打的一波。

在這輪價格战裏，雲廠商是最重要的發起方之一，先有字節的火山引擎，後來百度智能雲、阿裏雲、騰訊雲先後加入。

對雲計算公司來說，大模型商業化能不能跑通，並不重要。更重要的是，如何依托於大模型新需求，打破過去雲廠商的格局，重新建立自己的領先位置。

根據媒體報道，阿裏雲內部已經提出一個非常激進的目標，在三年之內，要佔領國內大模型雲計算市場的90%。這也是爲什么阿裏把國內5家大模型獨角獸都投了一遍。

而火山引擎自2020年才對外提供服務开始，一直想以傳統雲計算模式去追趕大廠，始終沒有太大起色。大模型出現改變了這一切。去年以來，它开始將字節跳動的AI能力作爲突破口，試圖打破舊有格局。這次降價也是這一邏輯下發生的。

事實上，基於大模型賣雲服務並不是大廠唯一的商業模式。基於大模型重構應用，乃至打造大模型時代的超級應用，成爲大廠在AI時代的新目標。

如果能夠像互聯網和移動互聯網時代一樣，誕生淘寶、微信這樣的超級應用，大廠們又將迎來商業史上新的輝煌。

目前，百度已經完成了對百度文庫、百度搜索、百度地圖、如流等業務的AI重構。

阿裏對釘釘、高德地圖、闲魚、餓了么、優酷、盒馬、淘票票，天貓、淘寶等阿裏集團最核心的產品進行了全面升級。

字節內部也开啓了賽馬機制，抖音、剪映等50多個業務线各自爲營开始了AI探索。過去一年裏，除了主打的豆包App外，基於豆包大模型，還推出了互動娛樂應用“貓箱”，以及星繪、即夢等AI創作工具。

騰訊則將混元大模型落地在超600個騰訊內部業務和場景中，包括企業微信、騰訊會議、騰訊文檔等“一門三傑”產品，也包括騰訊樂享、騰訊電子籤、騰訊問卷、騰訊雲AI代碼助手等協作SaaS產品。

相比大廠的高舉高打，大模型創業公司就顯得不那么從容了。

百川智能創始人王小川表示，百川並不會“摻和”到價格战當中，原因在於，當前To B並不是百川的主要商業模式，價格战對其影響有限，百川更多的精力，還是會放在超級應用當中。

零一萬物的李开復博士認爲，目前零一萬物帶給的性能、性價比都很高了，不打算降低YI系列模型的API價格。“就像特斯拉，他不會因爲別的牌子車比他賣得很便宜，他也要來降價。”

率先掀起價格战，喊着“不做應用做研究”的DeepSeek，也沒有在各家大廠密集召开降價發布會時發聲，顯得無心參战。

無論創業系公司如何自圓其說，和財大氣粗的大廠相比，一不小心都有可能震蕩出局。

更大的挑战在於，國內大廠和大模型廠商基本都走模型+應用路线，推出各自的To C App，不少AI助手也已經开始大規模的市場投放。

不管是基礎大模型的價格战，還是To C應用的用戶爭奪战，战火都已經燒起來了。

結語

無論從哪個角度看，把大模型拉入價格競爭，都不是一個明智的做法，也不一定會讓大模型廠商迎來商業閉環。但現實是，這事就這樣發生了。

既然大模型未來的發展誰都看不清，那就先降價把用戶拿下來再說。這是移動互聯網過去10年被證明過無數次的真理。

拿到用戶，不管商業化能不能跑通，至少融資、並購後面還有的聊。但沒有用戶，你連上談判桌的資管都沒有。