“卷王”豆包上桌，壓力給到了誰？

2025-01-03 18:40:26 編輯： robot

導讀 “ 大模型廠商價格战停不下來，反映的恰恰是對未來的焦慮。在這場大模型的軍備競賽中，豆包想要上演“大力出奇跡”的戲碼。 ”@科技新知原創作者丨思原編輯丨蕨影大模型賽道打了一年的價格战，還在繼續...

“

大模型廠商價格战停不下來，反映的恰恰是對未來的焦慮。在這場大模型的軍備競賽中，豆包想要上演“大力出奇跡”的戲碼。

”@科技新知原創

作者丨思原編輯丨蕨影

大模型賽道打了一年的價格战，還在繼續……

就在新年前一天，阿裏雲宣布2024年度第三輪大模型降價，通義千問視覺理解模型全线降價超80%。

同樣，前不久火山引擎的Force大會上，除了大力宣傳豆包外，最值得關注的還是價格的再次下降。目前豆包視覺理解模型輸入價格爲0.003元/千tokens，1塊錢可處理284張720P的圖片。

此前去年5月份，豆包通用模型pro-32k版，推理輸入價格爲0.0008元/千tokens，價格不到1釐。此舉迫使阿裏雲對其三款通義千問核心模型進行新一輪降價，降幅高達90%。而百度智能雲則更爲激進，宣布文心大模型旗下的兩款主打產品——ENIRE Speed與ENIRE Lite，將全面免費开放。

按照火山引擎總裁譚待的說法，“市場需要充分競爭，降低成本是技術優化的結果，做得最好才能活下來”。顯然，在這場大模型的軍備競賽中，豆包想要上演“大力出奇跡”的戲碼。

但在字節大肆內卷之下，也有質疑不斷：豆包的價格真的足夠便宜嗎？爲什么大模型要卷價格？未來價格還會成爲企業拿單重點嗎？

01降價誇張？滿是套路

想要理解大模型商家的套路，就需要了解大模型的商業模式。據“遠川科技評論”梳理，目前來看各家提供的服務主要可分爲三種：

一是包含模型推理的基礎服務，指的是根據輸入的信息內容，給出回答的過程。簡單來說就是“實際使用”模型的過程。這部分各家都有不同的模型標准。

二是模型精調，廠商可以根據客戶需求按token使用量（訓練文本＊訓練迭代次數）計費，訓練完成後出账，按量後付費。

第三種便是模型部署，就相當於一個客戶獨佔了一部分算力資源，屬於大客戶，其收費模式，也是按照消耗的計算資源或者模型推理的token數量以量計價。

這3種收費模式，代表的也是大模型开發由淺入深的過程。而各大科技公司瘋狂砍價的，其實是第一種基礎服務，即標准版模型的推理費用。而這部分定價又分成了“輸入”和“輸出”兩部分。簡單來說，輸入就是用戶提問的內容，而輸出則是大模型的回答。

在調用大模型時往往會根據輸入和輸出的token數量，進行雙向計費。這種細微差異，很容易成爲大模型公司的套路。

例如，豆包的通用模型Doubao Pro-32k，輸入價格爲“0.8元/百萬tokens”，按照官方說法是比行業便宜了99.3%，一些主流模型也都开始了降價，比如阿裏雲三款通義千問主力模型Qwen-Turbo價格較之前直降85%，低至百萬tokens 0.3元，Qwen-Plus和Qwen-Max的輸入價格分別再降價80%和50%，分別爲0.8元/百萬tokens和20元/百萬tokens。

但輸出價格方面有所差別，2元/百萬tokens的價格與Qwen-Plus、DeepSeek-V2等同行持平，甚至比比Qwen-Turbo、GLM-4-9B等一些同行產品價格更高。

再看最新的豆包視覺理解模型Doubao-vision-pro-32k，輸入化爲每百萬tokens的售價爲3元，大概是0.4美元，輸出直接來到了9元，大概爲1.23美元。按照豆包說法，這個售價比行業平均價格便宜85％。

但對比幾個直接競爭者：阿裏的多模態模型Qwen-VL系列在最近降價後與其價格一致；多模態的Gemini 1.5 Flash模型每百萬輸入tokens報價爲0.075 美元、每百萬輸出tokens成本爲0.3美元，對於較小的上下文（小於128k）還另有折扣價；GPT-4o mini則是輸入0.15美元，輸出0.6美元。

不過不止豆包，國內其他廠商基本也都有類似的降價“套路”。例如百度宣布免費的ERNIE-Speed-8K，如果實際部署，收費就變成了5元/百萬tokens。還有阿裏的Qwen-Max，實際與字節跳動的豆包通用模型Pro-32k一樣，只是降低了輸入的價格。

值得一提的是，標准模型推理的降價確實可以讓中小开發者降低成本，但只要稍微更進一步的使用，就涉及到了模型微調和模型部署，然而這兩項服務一直都不是價格战的主角，並且也沒有太大降價幅度。

簡單來說，各家降價最狠的其實都是輕量級的預置模型；相比之下，性能更強悍的“超大杯”模型，實際降價幅度沒有那么誇張。例如精調的Doubao-pro系列的價格都在50元/百萬tokens，比阿裏、騰訊這些廠商的旗艦主力模型價格更高。

各大廠商風風火火的掀起的價格战，就像是打網遊，用各種形式吸引玩家，再在遊戲中加上各種玩法，總之就是想要變強就要氪金。當然，即便如此，各個大廠也算是真金白銀的付出很多，那么爲什么這些廠商在一直圍繞價格大費周章呢？

02想做好，熱度不能停

縱觀大模型行業，字節跳動一定算不上起跑最快的那一批選手，甚至今年年初，字節跳動CEO梁汝波在內部講話中提到“遲鈍”二字，直指字節對大模型的敏感度不如創業公司。

“直到2023年才开始討論GPT，而業內做得比較好的大模型創業公司都是在2018年至2021年創立的。”他說。

後來者往往是最需要內卷的那個，字節跳動也是如此。從今年年中开始，便开始制造一輪又一輪熱度。

除了上文所說的，豆包在B端的讓利降價意圖明顯外，C端市場豆包也是全力出擊。

面向C端，無論是线上平台，還是线下公开場所，都能看到豆包的身影。據“連线Insight”援引AppGrowing統計，截至11月15日，國內十款AI原生應用中，Kimi和豆包是投放最瘋狂的兩個產品，分別投放了5.4億元和4億元。

拉長時間线看，豆包的投流顯然更猛烈。據AppGrowing統計，2024年4月—5月，豆包投放金額預計爲1500萬元-1750萬元。6月上旬，豆包再次啓動新一輪大規模的廣告投放活動，投放金額高達1.24億元。

除了投流外，豆包還有抖音這一流量池，字節幾乎屏蔽了除了豆包以外所有AI應用在抖音上的投放。目的也很明確，就是要徹底解決大模型應用的“用戶焦慮”。

然而，現實往往事與愿違。據“智能湧現”報道，字節內部反思——豆包目前的用戶活躍度並不算高。豆包每周僅活躍2至3天，且每天用戶發送消息輪次僅爲5到6次，單次2分鐘左右，用戶人均使用時長僅爲10分鐘左右。上述這些數據在過去一年中的增長幅度並不顯著。

簡單來說，不計成本的投流，雖然讓豆包成了國內用戶數量斷層式第一的AI軟件，但仍然算不上是一款killer app。

字節管理層對此的判斷是，像豆包這樣的AI對話類產品可能只是AI產品的“中間態”。字節內部判斷，付費訂閱模式在中國不太可能走通。而時長和輪次太低，又導致潛在的廣告空間較小，這都構成了這類產品的隱形天花板。

所以長期來看，更低門檻、更“多模態”的產品形式更具落地可能，剪映和即夢可能是合適的入口，這也是此次大會豆包將部分重點放在視頻模型的本質原因。

但站在用戶角度，根據“財經雜志”報道，大部分用戶买單的原因是產品和服務能帶來價值，價值不光是解決具體問題，如提升工作效率、提供情感陪伴等，市場上還有一類價值是“符合政策方向”。更重要的要具備找到具體客戶並交付的能力，這考驗的是AI公司在技術和產品之外的能力，甚至在很多時候，這項能力比技術實力更能幫助AI公司成長。

中國的AI市場和美國不同，很難通過平台銷售軟件的模式打开市場，大部分時候需要抓住一個個的項目和工程來實現商業化。而這些項目和工程的來源，往往與自身熱度有關。

“一家成熟的企業在布局大模型時，很難會去考慮一個不成熟的產品或者企業。在不考慮成本的情況下，大品牌往往是首選，這不僅是技術上的信任，更多是服務、整體質量的信任”，一位科技企業管理人員向「科技新知」表示，“畢竟小廠的風險還是有的，就像买車，开着开着車廠倒閉了，那就損失大了”。

初創公司大肆制造熱點新聞，大概率是爲了融資，是爲了活下去，而豆包這種本就有背景的，則是想要靠着熱度去找到並且固定更多客戶，但圈內一個默認的事實就是，無論是誰、無論技術多厲害，都要善於保持熱度，畢竟酒好也怕巷子深。

03淘汰賽，或告別價格战

其實不止豆包，目前市面上所有二线及以下的大模型廠商，都處在花錢买流量的階段，爲的是留住用戶。因爲這一場不折不扣的“卷王秀”背後，是瘋狂的產品能力和研發速度，更意味着這場關於“擠泡沫”的大模型服務商淘汰賽，再次吹響了號角。

2024年已經經歷了一輪淘汰賽洗禮，讓大模型去九存一，產業格局更加合理，只留下了約10%的大模型進入決賽圈。

然而，這並不是結束，而是开始。只是在「科技新知」看來，新一輪淘汰賽的重點，價格不再是主導因素而是技術。

目前科技公司們也开始陸續意識到，僅發布一個免費的應用，並不能爲公司帶來直接收益，C端用戶量很難增長，獲客成本已經明顯提升。更重要的是去直接觸及那些愿意付費的B 端客戶，例如金融、政務、汽車等行業。

但是通常有大量公司集中進入某個行業時，會出現持久的價格战，因爲各家都需要打造一個標杆客戶，來爲之後的市場拓展鋪路。簡單粗暴的價格战會讓一些公司主動或被動退出，待市場穩定後，再將價格恢復常態。

但矛盾之處在於，“有錢”的領域大家都想進入。而長久的價格战下，技術成本變成了制勝關鍵，簡單來說，同樣的解決方案和報價下，誰的技術成本更低，誰就能虧得更少，活得更久。

而技術成本取決於企業的硬件成本和算法邏輯，這點目前國內主流的大模型廠商基本處在同一水准，並且迭代和互相追趕的速度也不相上下，但這不代表可以高枕無憂。

今年9月，OpenAI的“王炸”o1模型的問世也讓各家看到了差距，與現有的大模型相比，o1最大的特點就是“推理式AI”，它在回答復雜問題時會花費更多時間來逐步推演問題。這種延時思考並不是缺點，反而讓o1更接近人類真實的邏輯推理方式。

從“生成式AI”到“推理式AI”，o1的推出預示着AI進入了一個全新的階段。而更令人震驚的是，在o1發布的3個月後，下一代o系列產品o3便橫空出世，並且o3有完整版和mini版，新功能是可將模型推理時間設置爲低、中、高，模型思考時間越高，效果越好。mini版更精簡，針對特定任務進行了微調，將在1月底推出，之後不久推出o3完整版。

這也意味着快速迭代下，目前主流的生成式AI，即將成爲歷史產品。

“價格是影響大模型企業的因素，但更重要的還是技術能力，”一位大模型應用开發者向「科技新知」表示，“目前國內如阿裏、昆侖萬維等企業也都推出類o1模型，雖然有差距，但也代表了他們也都認同這一趨勢。”

一位業內專家也表示，國內企業走的思路是集成思維鏈、用搜索方式提升深度推理能力、加入反思策略和算法提升邏輯推理性能，但目前還未完全超過OpenAI。

值得一提的是，國內最近比較火的DeepSeek-V3，採用的蒸餾技術給行業提供了新思路，但同時也陷入“優化GPT”的爭論。

而針對AI訓練可能使用合成數據（大模型生成數據）這一話題，倫敦大學學院（UCL）名譽教授和計算機科學家彼得·本特利表達了擔憂，稱“如果繼續在其他AI的輸出上訓練AI，結果可能是模型崩潰。確保高質量AI的唯一方法是，爲其提供人類的高質量內容。”

“缺乏參照的現成开源架構，不清楚o1模型做後訓練時強化學習的方式以及使用的數據集，樹搜索、COT未开源，訓練數據污染、國產模型推理性能提升困難，這些都是目前國內企業的難點，”該專家補充道，“不過若有支持o1架構的开源模型出現會加速這一過程，過程中會有兩三家先跑，其他家後跟進。”

如果根據以往GPT系列的發展節奏，全廠商跟上o系列的步伐大概率會在2025年上半年到來，而在這之後，目前的技術也將逐漸退出歷史舞台，所以對於大模型廠商來說，與其坐等被淘汰，不如在淘汰之前讓迭代技術發揮更大作用。

總的來看，未來價格雖仍會是影響企業拿單的因素之一，但隨着技術的快速迭代和行業的發展，技術能力將越發關鍵，只有不斷提升技術、降低成本、優化服務，大模型廠商才能在即將到來的淘汰賽中存活下來。

參考資料：[1]《豆包再降價，字節“飽和式”進攻仍在繼續》，連线Insight [2]《大模型價格战，還能再狠一點》，遠川科技評論[3]《中國大模型洗牌年將开啓，暗藏兩大邏輯》，財經[4]《字節內部判斷AI對話類產品天花板可能不高，提升剪映即夢優先級》，智能湧現