最近一周,鋪天蓋地都是大模型降價的消息。字節降完,智譜降;阿裏降完,百度降;騰訊降完,科大訊飛降......是不是很像蹲蘿卜的遊戲?
事實上,國內有頭有臉的大廠幾乎都加入了這場遊戲。接二連三地降價,讓人一瞬間有了當年共享單車和雲計算價格战的感覺。
互聯網時代,所有人都習慣於大規模燒錢來獲得最後的勝利。但AI時代,這套玩法還行得通嗎?
國產大模型“以釐計價”
降價在商業世界裏並不難理解,無非是“降價促銷”、“以價換量”。
大模型領域的扛把子OpenAI就已經多次降價。
從去年3月OpenAI發布GPT4到現在,其產品從GPT4升級到GPT-4o,輸入價格從0.03美元/千tokens下降到0.005美元/千tokens,降幅爲83%;輸出價格從0.06美元/千tokens下降到0.015美元/千tokens,降幅爲75%。
但驚人的是,國內大模型比OpenAI更狠,直接把價格“打骨折”。
5月11日,智譜AI大模型的個人版GLM-3Turbo模型產品的調用價格從0.005元/千tokens降低至0.001元/千tokens,直降80%;GLM-3Turbo Batch 批處理API也便宜了50%,價格僅爲0.0005元/千tokens。
緊接着,5月15日,字節宣布豆包通用模型pro-32k版、pro-128k版在企業市場的推理輸入價格僅爲0.0008元/千tokens、0.005元/千tokens,較行業降幅達99.3%、95.8%,並聲稱已經擊穿了大模型行業的最底價。
但“價格屠夫”還在後面。5月21日,阿裏雲通義千問GPT-4級主力模型Qwen-Long的API輸入價格降至0.0005元/千tokens,直降97%。
各大廠動不動就降價90%以上,已經是硝煙四起,然而還有更狠的角色——百度直接宣布文心Speed和文心Lite兩款模型免費,开啓了大模型API調用的“免費時代”。
5月22日,騰訊也按耐不住了,宣布主力模型之一的混元-lite 模型不僅從4k升級到256k,而且全面免費。同日,科大訊飛首推永久免費大模型,訊飛星火API能力向全球用戶开放。有網友戲稱,大模型正從“以分計價”的定價模式向“以釐計價”的時代邁進。
價格战提前來臨?
其實大模型降價並不稀奇,但稀奇的是商業化還沒跑通,怎么價格战就先來了?
根據此前預期,大模型大致將按照每年50%-75%幅度降本,但現在大模型的降本速度遠超預期。
答案很簡單:加快商業化落地。
隨着大模型參數越來越大,研發成本也越來越高。在巨大的成本壓力下,大模型廠商不得不加緊尋找一條商業化之路。
根據無問芯穹發起人汪玉,用公开數據做了一次針對算力成本數量級的測算,假設GPT-4 Turbo每天要爲10億活躍用戶提供服務,每年的算力成本可能超過兩千億,這還不包括模型訓練的投入。
華爲大模型負責人田奇曾提到,大模型开發和訓練一次需要約1200萬美元,這表明即使技術再領先的公司,大模型的訓練也是非常昂貴的。
百川智能創始人CEO王小川也曾表示,每1億參數對應訓練成本在1.5到3萬人民幣之間。因此,一個千億級參數的模型單次訓練成本預估在3000萬至5000萬人民幣之間。
顯然,高昂的研發價格,已經成了AI商業化的枷鎖。絕大部分公司的收入仍然還在億的級別。以這種成本去打造商業閉環,顯然是不成立的,而降價就成了最直接且最快速的落地方式。
同時,價格战能掀起的另一個因素是,大模型技術已經卷得差不多了。
外賣、快遞、網約車、社區團購乃至新能源車等價格战火熱的行業,或多或少都是由於同質化競爭而導致的,大模型也可能是當前卷性能帶來的收益越來越低。
在《LLMs正達到收益遞減的證據——及其可能意味着什么》一文中,作者認爲大模型在性能提升方面可能已達到收益遞減的臨界點。以OpenAI爲例,從GPT-2到GPT-3、GPT-3到GPT-4都有巨大的飛躍,但GPT-4到GPT-4 Turbo就沒有那么多了。
如果大模型的性能發展真的要迎來一面牆,那么對於大模型公司來說,如何搶下用戶是現階段最重要的一步。
目前,國內大模型先頭部隊大多已接近GPT-4的能力,而這一能力已具備商業化的基礎。經過一年多的技術比拼,大模型顯然已經到了大規模市場驗證的階段。
因此,2024年大模型开始了從“卷技術”向“卷應用”的轉變,商業化、落地應用成爲大模型公司的主旋律,而降價將爲大模型的應用落地帶來了極大推動力。
誰能扛住價格战?
雖然大家都在價格上卷起來了,但並不是所有企業都能加入價格战。
降價涉及到大模型的研發、訓練、推理等一系列成本的優化,只有把大模型的研發成本盡可能的降低到最小,才有降價的空間和資本。
毋庸置疑,大廠是最扛打的一波。
在這輪價格战裏,雲廠商是最重要的發起方之一,先有字節的火山引擎,後來百度智能雲、阿裏雲、騰訊雲先後加入。
對雲計算公司來說,大模型商業化能不能跑通,並不重要。更重要的是,如何依托於大模型新需求,打破過去雲廠商的格局,重新建立自己的領先位置。
根據媒體報道,阿裏雲內部已經提出一個非常激進的目標,在三年之內,要佔領國內大模型雲計算市場的90%。這也是爲什么阿裏把國內5家大模型獨角獸都投了一遍。
而火山引擎自2020年才對外提供服務开始,一直想以傳統雲計算模式去追趕大廠,始終沒有太大起色。大模型出現改變了這一切。去年以來,它开始將字節跳動的AI能力作爲突破口,試圖打破舊有格局。這次降價也是這一邏輯下發生的。
事實上,基於大模型賣雲服務並不是大廠唯一的商業模式。基於大模型重構應用,乃至打造大模型時代的超級應用,成爲大廠在AI時代的新目標。
如果能夠像互聯網和移動互聯網時代一樣,誕生淘寶、微信這樣的超級應用,大廠們又將迎來商業史上新的輝煌。
目前,百度已經完成了對百度文庫、百度搜索、百度地圖、如流等業務的AI重構。
阿裏對釘釘、高德地圖、闲魚、餓了么、優酷、盒馬、淘票票,天貓、淘寶等阿裏集團最核心的產品進行了全面升級。
字節內部也开啓了賽馬機制,抖音、剪映等50多個業務线各自爲營开始了AI探索。過去一年裏,除了主打的豆包App外,基於豆包大模型,還推出了互動娛樂應用“貓箱”,以及星繪、即夢等AI創作工具。
騰訊則將混元大模型落地在超600個騰訊內部業務和場景中,包括企業微信、騰訊會議、騰訊文檔等“一門三傑”產品,也包括騰訊樂享、騰訊電子籤、騰訊問卷、騰訊雲AI代碼助手等協作SaaS產品。
相比大廠的高舉高打,大模型創業公司就顯得不那么從容了。
百川智能創始人王小川表示,百川並不會“摻和”到價格战當中,原因在於,當前To B並不是百川的主要商業模式,價格战對其影響有限,百川更多的精力,還是會放在超級應用當中。
零一萬物的李开復博士認爲,目前零一萬物帶給的性能、性價比都很高了,不打算降低YI系列模型的API價格。“就像特斯拉,他不會因爲別的牌子車比他賣得很便宜,他也要來降價。”
率先掀起價格战,喊着“不做應用做研究”的DeepSeek,也沒有在各家大廠密集召开降價發布會時發聲,顯得無心參战。
無論創業系公司如何自圓其說,和財大氣粗的大廠相比,一不小心都有可能震蕩出局。
更大的挑战在於,國內大廠和大模型廠商基本都走模型+應用路线,推出各自的To C App,不少AI助手也已經开始大規模的市場投放。
不管是基礎大模型的價格战,還是To C應用的用戶爭奪战,战火都已經燒起來了。
結語
無論從哪個角度看,把大模型拉入價格競爭,都不是一個明智的做法,也不一定會讓大模型廠商迎來商業閉環。但現實是,這事就這樣發生了。
既然大模型未來的發展誰都看不清,那就先降價把用戶拿下來再說。這是移動互聯網過去10年被證明過無數次的真理。
拿到用戶,不管商業化能不能跑通,至少融資、並購後面還有的聊。但沒有用戶,你連上談判桌的資管都沒有。
在這種情況下,大模型廠商降低开發者成本,讓更多开發者參與進來,幫助他們去觸碰曾經觸碰不到的用戶,顯然就是一條必經之路。
【科技雲報道原創】
轉載請注明“科技雲報道”並附本文鏈接
原文標題 : 大模型“以釐計價”,誰能扛住價格战?
標題:大模型“以釐計價”,誰能扛住價格战?
地址:https://www.utechfun.com/post/376295.html