打完“價格战”,大模型還要比什么

2024-10-13 18:40:08    編輯: robot
導讀 來源 | 伯虎財經(bohuFN)  作者 | 楷楷  在近日舉辦的2024年雲棲大會上,阿裏再次成爲了焦點。 今年5月,阿裏雲宣布旗下通義千問的多款商業化及开源模型進行大幅降價,最高降價幅度高達9...

圖片

來源 | 伯虎財經(bohuFN) 

作者 | 楷楷 

在近日舉辦的2024年雲棲大會上,阿裏再次成爲了焦點。

今年5月,阿裏雲宣布旗下通義千問的多款商業化及开源模型進行大幅降價,最高降價幅度高達97%;雲棲大會上,通義千問三款主力模型再次大幅降價,最高降幅達85%。

自阿裏在5月率先“开卷”之後,字節跳動旗下雲服務火山引擎、百度智能雲、騰訊雲、科大訊飛等均官宣旗下大模型大幅下調價格,行業降價幅度達到了90%左右。

不僅國內大模型廠商跟進價格战,行業風向標 OpenAI 也在今年7月推出了GPT-4o mini ,商用價格較GPT-3.5 Turbo 便宜了60% 以上。

可以預見,在阿裏再掀“價格战”之後,大模型價格還將繼續下調,甚至可能走向“負毛利”。在互聯網行業的發展史中,“虧本換規模”並不是某個企業的孤例,要改變整個行業的商業模式,必然需要投入更高的成本。

但在這個過程中,如何平衡價格、質量與服務也成爲了大模型企業必須思考的問題,企業想要“活下來”,就不能只喫“低垂的果實”。

01 規模比利潤更重要

國內大模型已從“以分計價”的定價模式走向“以釐計價”的新時代。今年5月,阿裏通義千問大模型的API調用輸出價格,從0.02元/千Tokens降至0.0005元/千Tokens。

在9月再次降價之後,阿裏雲Qwen-Turbo(128k)、Qwen-Plus(128k)、Qwen-Max 三款模型每千 tokens的最低調用價格再次刷新下限,分別降至0.0003元、0.0008元、0.02元。

圖片

對於再次降價,阿裏雲CTO周靖人表示,每一次降價都是一個非常嚴肅的過程,要從整個產業發展,开發者、企業用戶的反饋等各方面進行權衡,(降價)不是“價格战”,(大模型價格)還是太貴了。

隨着一個行業的成熟發展,其走向降價趨勢也是必然的,比如半導體行業的“摩爾定律”,即處理器的性能大約每兩年翻一倍,但工藝的進步會使成本下降爲之前的一半。

但目前來看,大模型行業的降價速度已經遠超“摩爾定律”,降價幅度接近100%,在這樣的背景下,大模型企業還能盈利嗎?或許對大模型行業來說,當前規模比利潤更重要。

一方面,暫時讓渡利潤已是大模型行業的共識,業內人士認爲,大模型行業甚至可能已經到了“負毛利時代”。

據《財經》雜志報道,阿裏雲、百度智能雲等多位負責人曾透露,今年5月以前,國內大模型推理算力毛利率高於60%,和國際同行基本一致,但在5月接連降價後,毛利率則跌至負數。

在大模型降價以後,使用者數量會持續增多,短期內調用次數越多,大模型的虧損就越大,因爲每次調用模型都要消耗價格不菲的算力,也就是說大模型企業不僅要降低售價,還要面臨更高的成本投入。

但另一方面,大模型降價帶來的效果也是顯著的。以阿裏雲爲例,在大模型降價以後,阿裏雲百煉平台的付費客戶數比上一個季度增長了超過200%,更多企業放棄私有化部署,選擇在百煉上調用各類AI大模型,目前百煉已服務超30萬個客戶。

過去一年,百度文心大模型的降價幅度也超過90%,不過,百度在2024年Q2財報電話會上披露,文心大模型日均調用量超6億次,半年內增長超10倍。

如此看來,大模型企業寧愿犧牲利潤也要降價,所求的正是“預期”,即犧牲短期利益來換取長期回報。

有業內人士估計,目前各家大模型企業在模型調用領域的收入不會超過10億元,相較於百億元級別的總營收,這筆收入只是“九牛一毛”。

但在未來1-2年,大模型調用次數至少有10倍以上的指數級增長,短期來看,用戶規模越大,大模型的算力成本越高;但長期來看,在雲服務領域,算力成本有望隨着客戶需求增長逐漸攤薄,企業將會迎來“回報期”。

隨着行業的持續發展,AI對算力的拉動會越來越明顯,阿裏CEO吳泳銘曾表示,在算力市場上,超過50%的新需求都是由AI驅動產生的,大模型正在加速商業化。

一方面,降價大大降低了企業客戶的使用門檻和試錯成本,特別是對政務、制造、能源等傳統行業來說,它們的業務規模更大,增量空間也更大。

當大模型能夠像其他基礎設施一樣人人可用時,大模型的市場空間才能有望實現大幅增長,在這之前,大模型企業難免需要讓利給企業和开發者。

另一方面,大模型降價後存量收入會下降,但增量收入會增長。以百度爲例,大模型不僅帶來了直接收入,比如文心大模型等產品的調用等,還能帶動間接業務的收入,比如百度智能雲業務。

過去幾年,外界對百度智能雲战略不乏質疑,其在公有雲市場並不佔優勢,但在AI公有雲這個細分市場,百度开始彎道超車。目前,百度智能雲的大模型收入佔比已從2023年四季度的4.8%提升到了2024年二季度的9%。

圖片

所以,目前大模型行業的共識,就是規模比利潤更重要,這一觀點在互聯網時代也是老生常談,比如“千團大战”“網約車大战”“電商大战”等。大模型企業不能回避“價格战”,就只能將活過價格战作爲初步目標,希望能成爲淘汰賽結束後的最終受益者。

02 阿裏着力“AI大基建”

阿裏也深知這一道理,其在近日宣布大模型再次降價後,也提出了“AI大基建”的概念。阿裏雲副總裁張啓表示,現在的AI相當於1996年前後的互聯網,當時的上網資費很貴,這也限制了移動互聯網的發展,只有把資費降下來,才有可能談未來的應用爆發。

所以,阿裏除了在2024年雲棲大會上提出大模型再次降價之外,還發布了新一代的开源大模型,一口氣上架了100 多個模型,涵蓋多個尺寸的大語言模型、多模態模型、數學模型和代碼模型,創造了大模型开源的“數量之最”。

圖片

阿裏雲CTO周靖人表示,阿裏雲堅定不移地推進开源战略,希望把選擇留給开發者,讓开發者會基於自己的業務場景去做模型能力增強和推理效率增強的權衡與選擇,同時也能更有效服務企業。

根據阿裏的統計,截至 2024 年 9 月中旬,通義千問开源模型下載量突破 4000 萬,Qwen 系列衍生模型總數超過 5 萬個,成爲僅次於 Llama 的世界級模型群,而Llama正是大模型开源界的“頭把交椅”,全球下載量接近3.5億。

在“百模大战”結束之後,多位行業大佬均認爲“卷模型不如卷應用”,大廠也开始聚焦“卷生態”。百度董事長李彥宏曾表示,“沒有構建於基礎模型之上的、豐富的AI原生應用生態,大模型就一文不值。”

目前,通過國家網信辦備案的大模型已達190多個,注冊用戶超6億,但仍難以解決大模型“最後一公裏”問題,難點不僅是大模型應用太少,還有大模型不夠“接地氣”,比如在醫療、金融等專業領域中,單純依靠“喂數據”訓練,大模型還是很難直接落地應用。

大廠不可能躬身入局每一個細分行業來完成“最後一公裏”,但可以通過打造完整的應用生態,由下遊企業或其他开發者自行“煉成”符合需求的模型產品,不僅能進一步優化資源配置,也能在這個過程中積累更多高質量數據,最終反哺給基礎大模型开發。

阿裏選擇降價、开源,本質就是希望降低大模型的使用門檻,通過更低的價格來驗證大模型的應用價值,讓更多企業和創作者參與進來。只有大模型能夠真正滿足企業的復雜業務場景需求,生態才能發展起來,行業才能進入新的階段。

不過,“百模大战”最終可能只會留下3-5家大模型企業,目前來看,行業第一梯隊已經呼之欲出,它們也可能會是大模型行業未來最基本的底座。

因此,頭部的大模型企業更不可能主動放棄價格战,讓出自己的市場份額。除此以外,不少獨角獸也希望憑借價格战殺出一條“生路”,部分企業也認爲小模型或更具性價比。

事實上,今年5月的大模型價格战並非始於阿裏,而是一條名爲“DeepSeek V2”的鮎魚,在行業普遍推理價格還是百元/Tokens的背景下,其將支持32k上下文的模型API定價爲1元/百萬Tokens(計算)、2元/百萬Tokens(推理)。

目前來看,大模型淘汰賽或還會持續2-3年,雖然最終留下的大模型企業並不會多,爲了活下去,企業們也不得不使出渾身解數,但問題是,當“低垂的果實”都被摘完之後,當下大模型行業的解題思路早已不是“便宜就完事”。

03 0模型能力仍是關鍵

不過,對於大模型“價格战”一事,行業也有不同的看法。零一萬物創始人李开復曾表示,沒有必要打瘋狂的價格战,因爲大模型不光要看價格,還要看技術,如果是技術不行,然後靠賠錢來做生意,(公司)不會對標這樣的定價。

火山引擎總裁譚待在談及價格战時也表示,當前主要關注的是應用覆蓋,而不是收入,要有更強的模型能力才能解鎖新場景,這才更有價值。

目前來看,“價格战”的本質還是因爲產品能力不足,各家模型能力趨於同質化,暫時無法形成斷檔的差距,所以才希望通過價格战來增加大模型的普及,也能幫助廠商增加市場份額。

但等到市場摘完“低垂的果實”,新問題也會接踵而來,企業能否扛下下一階段的價格战;大模型能否和對手拉开差距;自己會否成爲最終能夠留下來的企業,這些問題依然需要解決。

所以,大模型企業在打價格战的同時,也深知產品、技術、現金流的重要性,既要抗住降價壓力,又要和對手拉开技術差距,持續提升模型性能和產品落地,才能形成良性的商業閉環。

一方面,大模型企業並非單純依賴“價格战”。通常來說,大模型的推理包含時間、價格、生成 Token 數量三個變量,不能拋开單位時間內的並發數量,只看 tokens 價格。

因爲在實際跑業務的過程中,推理事件越復雜,越有可能要增加並發量。但目前降價大模型普遍使用的是預置模型(不支持增加並發量),真正大規模、高性能、支持高並發的模型推理均未有大幅降價。

另一方面,通過技術來進一步優化大模型的推理成本。以百度爲例,旗下的百舸異構計算平台對智算集群的設計、調度、容錯等環節進行了專項優化,能夠實現萬卡集群上的模型有效訓練時長佔比超過98.8%,线性加速比、帶寬有效性分別高達95%,幫助客戶解決算力短缺和算力成本偏高等問題。

微軟CEO薩蒂亞·納德拉曾舉例表示,過去一年 GPT-4 性能提升了6倍,但成本降低到了之前的1/12,性能/成本提升了70倍。不難看出,大模型技術的發展才是行業持續降價的底氣。

最後,則是打造出更有差異化的產品。低價策略能夠幫助大模型企業築造生態,但隨着AI領域的不斷發展,創新速度的加快也使得技術更新換代周期縮短,是否能夠持續提供有競爭力的產品,能否在實際應用中解決用戶痛點,才是大模型企業的核心競爭力。

目前,大模型行業的商業邏輯,已經從卷模式、卷成本,邁入到卷生態、卷技術的新階段。當然,低價還是快速建立生態壁壘的重要手段,但通過技術降低成本,才是推動大模型快進到“價值創造階段”的關鍵要素。

接下來,大模型企業的新战場將會是“性價比”,要在當前的價格基礎上,進一步提高大模型的質量和性能,讓模型能力更強、更多元,這么做或許不一定能孵化出“超級應用”,但吸引更多中小企業、創業公司的加入,才有機會爲大模型企業帶來爆發式增長的機會。

文章封面首圖及配圖,版權歸版權所有人所有。若版權者認爲其作品不宜供大家瀏覽或不應無償使用,請及時聯系我們,本平台將立即更正。 

 

       原文標題 : 打完“價格战”,大模型還要比什么?



標題:打完“價格战”,大模型還要比什么

地址:https://www.utechfun.com/post/431496.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡