大模型降價,一場沒有贏家的战爭

2024-05-23 18:40:12    編輯: robot
導讀 撰文 | 郝   鑫 編輯 | 吳先之 6.18卷價格的風吹到了大模型圈。 5月15日,火山引擎率先亮劍,宣布豆包主力模型在企業市場定價爲0.0008元/千 tokens,較行業便宜99.3%。其精...

撰文 | 郝   鑫

編輯 | 吳先之

6.18卷價格的風吹到了大模型圈。

5月15日,火山引擎率先亮劍,宣布豆包主力模型在企業市場定價爲0.0008元/千 tokens,較行業便宜99.3%。其精准狙擊同行的做法,直接掀起了一場大模型廠商低價肉搏战。

阿裏、百度、科大訊飛、騰訊紛紛站出來應战。

5月21日,阿裏雲官宣通義千問主力模型Qwen-Long輸入價格降至0.0005元/千 tokens,直降97%;僅隔了幾個小時,百度智能雲祭出必殺技,宣布文心大模型兩大主力模型ERNIE Speed、ERNIE Lite全面免費。

自百度之後,大模型徹底與免費掛上了鉤。

5月22日,科大訊飛宣布訊飛星火Lite API永久免費开放。下午,騰訊雲公布全新大模型升級方案,主力模型之一的混元-lite模型調整爲全面免費。

僅僅一周,大模型從“釐”時代跨入了“免費”時代。

表面是降價,背後的根本驅動力來自於技術。在經歷過一年多的技術追趕後,國內大模型廠商在算力、推理、算法等多個層面都實現了突破,從而實現了技術方面的降本。再加之大廠雲計算所帶來的規模化優勢,才共同引發了降價潮。

從另一方面也側面印證了,大模型從發布會demo進入了可用的新階段。火山引擎總裁譚待談到豆包大模型發布和降價時間點時提到了一個標准:“模型能力准備好了”。當下,各大模型廠商能夠大範圍开放使用的前提就是,模型能力通過測試,並且能夠穩定供給。

細究之下,大模型廠商的低價、免費,更像是引誘老鼠出洞的奶酪。

這種免費帶有諸多限制,阿裏、百度降價幅度最高的產品都是其偏輕量化的模型版本,僅適用於使用頻次不高、推理量不太大、任務處理量不太復雜的中小企業、开發者短期使用。

在這種情況下,低價、免費這些“互聯網”手段淪爲了大模型廠商的獲客策略,一邊獲得更多的數據來優化模型效果,一邊試圖通過嘗鮮來向更高階的付費版本轉化。

买得精不如賣得精,大模型廠商集體降價的背後仍有一系列問題值得探討。 

用互聯網免費大法賣AI大模型

從使用者的角度考慮,大模型降價潛在的受益對象可能有兩類:开發者和企業。

雖然行業內大規模降價是第一次,但早在去年,各大廠就通過贏黑客松比賽送token的方式,來吸引AI創業者和團隊的參與。

當時,就有黑客松常客告訴光子星球,“參加比賽就是薅羊毛,token不拿白不拿”。

薅羊毛確實可以降低創業成本。把價格打下來,對开發者特別是獨立开發者而言是友好的。這可能意味着开發者可以多跑幾圈測試,多獲得幾輪反饋數據,從而縮短產品上线的周期,進一步提升創業成功的可能性。

但前提是得滿足开發者和企業的需求。光子星球了解到,降價的消息傳出後,在开發者和企業當中呈現出了兩極化的聲音。

一方對國內大模型降價比較贊同,認爲开發者和企業可以繼續薅羊毛,畢竟現在市場上套殼應用產品的案例不在少數;另一方則覺得,大模型廠商的降價缺乏誠意,大幅降價的都是小規模模型,雖然對外聲稱水平可以對標GPT-4,但實際上連GPT-3.5都不如,模型水平不達標,根本無法在實際的生產環境中運行。

大模型廠商表面上的降價,實則背後暗藏玄機。這好比給了你一個雲盤限時體驗卡,剛看了三秒的高清視頻就彈出來升級VIP的提醒,也是恰巧剛體驗了5秒極速下載,就提醒你升級會員權限。

大模型的嘗鮮也是大差不差,打着降價、免費的噱頭,把开發者和企業吸引過來使用,才剛上手,就被开始卡調用速度、推理速度、任務處理量等關鍵指標。

而且,光子星球進一步發現,大模型廠商的降價策略並未對商業化造成實質性影響。呈現的結果就是,大模型廠商價格降了,錢也沒少賺。

某大廠內部人士告訴光子星球,大模型目前主要的商業化方式是拿to B訂單。類似於SaaS和雲的合作模式,存在case by case和合作提成兩種方式。

其中,case by case是更爲主流的合作方式,即大模型廠商的現有客戶會因爲本來就在使用某一廠商的雲和SaaS產品,順帶着开始嘗試該廠商的大模型。相應地,大模型廠商爲了留住客戶,也會在自家SaaS和雲產品上增加AI的功能。

這樣一來可能造成如下情況:大模型變成了SaaS產品或者項目合作的增值要素。大模型本身不付費,但爲了對衝成本,大模型廠商得反過來提高SaaS和項目合作的價格。羊毛最終出在羊身上,價格的一升一降,大廠非但沒虧反而照賺不誤。

大模型降價了,然後呢?

或許國內大模型價格战的影響在於,從現在起,大模型正式與“免費”劃上了等號。

這將成爲一次分水嶺,過去兩年,一衆創業者和團隊試圖建立的“上线即收費”的AI原生產品邏輯再次受到挑战。兜兜轉轉,互聯網的商業邏輯再次主導了大模型的發展。

無論國內外,行業中一直都存在着模型混用的狀態。本質上在於各家大模型各有所長,比如ChatGPT擅理,Claude擅文,正是基於不同模型的特性,用戶在不同的使用場景就會調取相應地模型。

類似的情況也發生在中國,我們了解到,金山辦公在研發WPS AI功能的過程中,就輪流嘗試了MiniMax、智譜AI、文心一言、商湯日日新、通義千問等大模型能力,通過了解各家大模型的優勢來搭建自己的平台。

去年,國內一家做數據治理的公司曾告訴光子星球,他們也會在前期大量地跑模型,測試不同模型的能力,在不同任務中擇優調取大模型的能力。這樣既進行了成本測試,也能避免對單一產品過度依賴。

到現在爲止,大模型產品時常被人詬病用戶黏性不高。相比於訂閱收費,按API調取收費的方式本就難以留客。

企業側的case by case收費模式亦是如此,企業使用某一家廠商的大模型周期,取決於訂單周期。客戶跟着訂單走,今天用字節,明天也可以用阿裏。

降價的本質是要加速大模型落地。大模型不能只停留在寫詩作畫,還得“下基層”。降價的背後是通過觸達千行百業和獲取更大樣本容量的合作案例,從中提取共性特徵,形成合理、高效的大模型行業標准。

當大模型廠商再次拉回到了同一起跑线上,在各家模型能力水平相近,價格不相上下的情況下,他們所要面臨的共同課題變成了如何留住客戶。

而站在大模型客戶的角度,他們更希望通過對衝,減少對單一模型的依賴。在這樣的心理驅動之下,未來的大模型模式可以參考SaaS和雲產品的採購方式,一家公司內部可以購买多家大模型公司產品,不同的產品线和業務部門也可能使用不同家的大模型。 

贏了價格,就贏了一切嗎?

回顧歷史,大模型一路從百模、參數、長文本打到了現在的價格。過去的經驗告訴我們,價格不可能是唯一的決定因素。

即使不談企業和开發者拿到手的東西對不對版,大模型廠商給出的價格在市場上也不是很有競爭力。

比國內大模型更具性價比的是开源大模型。一位國內負責電商代運營業務的工作人員告訴光子星球,截至目前爲止,自己業務部門購买過ChatGPT、Midjourney等AI相關的付費產品,現在底層使用的是开源且可商用的Llama 3。

一些公司和开發者更傾向部署开源模型的原因在於,一方面國外Llama等开源模型的能力一直在追趕最強版本ChatGPT的水平,一些通用場景能力在業務中足夠用。另一方面,從頭部署和精調模型,對後期業務調整也更靈活。

此外,光子星球發現,在閉源的大模型原廠和开源社區中間,還衍生出了中間商角色。一個令人費解的現象正在大模型行業蔓延:大模型分銷商賣的API價格比原廠價格還便宜。

以國外Deepbricks平台爲例,最新上架的GPT-4o模型,OpenAI官方輸入價格爲5美元/1M tokens,而Deepbricks自身的售價只要2美元/1M tokens。如果這些中間商真的能做到實時更新模型能力,還能做到低價,以後可能會吸引一批开發者和企業使用。

(圖源:Deepbricks官網)

Lepton AI 創始人、阿裏巴巴原副總裁賈揚清認爲,企業在使用AI的時候,並不是成本驅動。不是因爲API貴才沒人用,而是因爲企業首先得搞清楚怎么用來產生業務價值,否則的話,再便宜也是浪費。

若單純的價格不具有吸引力,客戶使用哪家大模型將取決於什么?

一位中間件的創業者向光子星球表示:“最主要看模型效果,如果模型效果太差再便宜也不能使用。”

還有海外的AI創業者直接跟光子星球說,國外用ChatGPT,因爲能力強;國內用文心一言,因爲能滿足合規需求。

於是,價格僅僅是企業選擇大模型其中一個因素。

同樣在雲計算和SaaS時代,往往能夠留住客戶的不是低價,而是更深層次的綁定關系或者利益關系。例如,當企業採用了火山引擎的豆包模型,是否就能在抖音投流享受到優惠權;接入通義千問,其產品是否就能與阿裏生態打通,獲得更多資源支持?

企業用戶選擇大模型的同時,也在權衡廠商的各自優勢。大模型能力的高低成爲了其次,更重要的是選擇這家廠商能給其業務帶來多少增長,在該廠商的產業鏈之下能獲得多大的收益。

到最後還是要拿結果說話,正如賈揚清所言,“也許不是最便宜的贏得商战,而是能落地的贏得利潤。”

       原文標題 : 大模型降價,一場沒有贏家的战爭



標題:大模型降價,一場沒有贏家的战爭

地址:https://www.utechfun.com/post/374803.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡