字節跳動大模型：實用，實用主義

2024-07-12 18:40:25 編輯： robot

導讀作者丨陳江來源丨零壹智庫字節跳動無疑是當前互聯網平台的流量之王，也是媒體眼中的實用主義者。在當紅的大模型賽道上，流量手段和實用路徑依然體現得淋漓盡致。 01 “算法”基因其實，字節挑動在A...

作者丨陳江

來源丨零壹智庫

字節跳動無疑是當前互聯網平台的流量之王，也是媒體眼中的實用主義者。在當紅的大模型賽道上，流量手段和實用路徑依然體現得淋漓盡致。

“算法”基因

其實，字節挑動在AI方面的布局、應用的時間可能遠早於一衆大廠。2012年剛成立的時候，字節推出基於智能推薦算法的產品“今日頭條”APP，成爲國內最早將人工智能技術運用到移動應用場景的科技公司之一。

2016年，字節跳動更進一步，成立人工智能實驗室，开始針對AI技術進行系統性的研發與儲備。2019年，字節收購了英國一家利用人工智能創作音樂的公司Jukedeck，後者創始人&CEO埃德·牛頓-裏克斯（Ed Newton-Rex）隨後加盟字節跳動並擔任人工智能實驗室主任。

2020年之後，字節又將AI技術廣泛應用在抖音、今日頭條等APP上，推出繪畫、特效類等AIGC功能，同時也積極探索大模型應用場景，比如抖音AI繪圖、飛書智能夥伴、剪影AI生成視頻等。

除了自己發力研發外，字節跳動還對外做了大量的人工智能相關投資。

據零壹智庫梳理統計，截至目前，字節在人工智能領域出手投資達到26次（含並購），其中行業應用層面19次，佔比73.1%。

在大模型方面，字節比百度等大廠略晚，2023年8月，宣布雲雀大模型上线，但也趕上了備案頭班車，成爲國內首批算法備案的大模型之一。這亦是“豆包”等一些列應用產品的技術支撐與底座。上线後，該大模型每天平均處理的token數量高達1200億，相當於1800億的漢字或生成3000萬張圖片。

全家桶

今年5月15日，2024春季火山引擎FORCE原動力大會在北京舉行。會上，字節跳動旗下火山引擎正式全員亮相了豆包大模型。這是一個模型大家族，包括通用模型pro、通用模型lite、語音識別模型、語音合成模型、文生圖模型等9款產品。

而此時，豆包在流量上已經以迅雷之勢站上舞台中央。

據原動力大會發布的數據顯示，豆包在蘋果APP Store和各大安卓應用市場的下載量突破1億，在AIGC類應用中排名第一，月度活躍用戶突破2600萬，智能體創建總數達800萬。

To B方面，火山引擎於2023年6月上线了MaaS平台，即火山方舟。這個平台匯集了國內科技公司和科研院所的優秀模型（比如百川智能、復旦大學MOSS等），有點類似打造大模型領域的電商平台模式，幫助企業爲不同場景選擇合適的模型，同時提供充沛算力、安全互信等方面的支持。

火山方舟發布後，公司與汽車、手機、金融、食品飲料等領域的龍頭企業展开了密切合作，包括吉利汽車、長城汽車、OPPO、vivo、小米、華碩、招商銀行、海底撈等。

不管是面向個人消費者的C端，亦或是面向廣大產業的B端，字節均是有了相當的用戶基數之後，再做大模型的全面發布。這種战略與其他絕大多數玩家是不一樣的，後者往往是將大模型和應用產品一同發布，再去开拓市場。

本次字節全員亮相的豆包大模型（前身即雲雀），涵蓋了文本對話、語音識別與合成、聲音復刻、角色扮演、文生圖等基礎功能與產品，並進行了多方面的升級。其應用場景非常廣泛，包括但不限於辦公智能助手、電商導購、營銷創作、編程助手等50余個業務場景。

針對B端，火山方舟已升級到2.0，可以讓企業更加高效、簡易地實現AI創新和應用落地，同時降低企業使用大模型的成本和技術門檻。應用場景包括智能外呼、數字人、數據助理等等。

價格战

爲了搶佔企業用戶市場份額，字節大模型大打價格战。其中，豆包主力模型在企業市場的定價爲0.00008元/千 Tokens，比行業價格降低了99.3%。

圖1：大模型定價對比（單位：元/千Tokens）

數據來源：火山引擎FORCE原動力大會，零壹智庫

對於大降價原因，火山引擎總裁譚待在接受媒體採訪時表示，一方面，字節跳動在在模型結構、訓練、生產等各種技術層面都能做到很好，有很多優化手段能夠實現降價。此外，市場對降價呼聲比較大，平台必須把試錯成本做到非常低，才能讓大家用起來。

另一方面，用戶規模的擴大也將提升大模型的性能。大的使用量，才能打磨出好模型，也能大幅降低模型推理的單位成本。

B端企業市場是大模型廠商的兵家必爭之地，因爲可以提供更直接、且可以預測的現金流收入。而C端要落地到具體應用中，需要很長的時間來开發市場、教育用戶，並且如何盈利一切都是未知數。

百度的文心一言、阿裏的通義千問服務的企業客戶衆多，分別高達8.5萬家、9萬家，市場佔有率相對更高一些。

豆包大模型價格大降，亦是想通過價格战與百度、阿裏正面PK，搶奪更多的企業用戶。

面對字節的打骨折，阿裏宣布跟進大降價，將通義千問GPT-4級別的主力模型Qwen-Long的API輸入價格，從每千個token的0.02元降至0.0005元，比字節還低0.0003元。

砸廣告

在C端市場，字節跳動亦是高舉高打。

據Quest Mobile數據顯示，2024年1月，豆包APP在人工智能生成內容（AIGC）APP活躍用戶排行榜中排名第一。到了3月，月活用戶量亦是文心一言的1.5倍。

即便如此，豆包依然不滿足，將重心放在如何搞流量上。

用戶活躍數、訪問使用量等核心經營指標是C端大模型廠商能否活下去，或者說未來能夠實現商業化的核心基礎。包括豆包在內的大模型廠商掀起了燒錢大战，买用戶。

據AppGrowing統計，2024年6月第一周（6/3-6/9），豆包素材投放量高達26521個，環比增長38.6%。相對而言，Kimi爲14451個，環比增長160.7%；智譜清言爲1866個，環比飆升2456%。

线上渠道方面，大廠們主要聚焦在吸納了衆多年輕人的B站社區上，6月第一周AI廣告投放量是去年同期的3-4倍。

除B站外，线上推廣渠道進一步擴散至小紅書、抖音等平台。比如，在抖音平台上，單個AI相關詞條下，豆包硬廣、軟廣外，還有頭部達人帶貨。在小紅書上，合作KOL發布體驗視頻、利用話題標籤增加曝光、舉辦互動問答和抽獎活動等方式進行推廣。

线下渠道方面，一二线主要城市的寫字樓、地鐵、機場等白領聚集的場所，都成爲推廣的重要战場。

僅僅在6月上旬，豆包廣告投放金額就已經高達1.24億元，令衆多大廠有些望塵莫及。

犯忌諱

此外，爲了流量，豆包大模型劍走偏鋒，甚至“不擇手段”。

今年5月底，據一些網友爆料，百度和谷歌的搜索結果中，除了廣告之外，第一頁全部來自豆包生成的內容。在谷歌搜索引擎裏更是生成超過2000萬條各式各類的詞條內容並進行固化。

這些內容也會關聯搜索引擎高點擊率的關鍵詞，從而獲取訪問流量，或者被其他大模型抓取並使用，以達到推廣豆包之目的。

豆包的做法，也並不難理解。簡單來說，通過數據進行訓練，訓練好後對人類的原創內容進行“洗稿”，再將之作爲“全新原創”內容，並通過算法進行大量分發，進入到搜索引擎數據庫中。

去年的一篇論文——《遞歸的詛咒：在生成數據上訓練會使模型遺忘》就詳細講解了當模型使用生成的數據進行訓練時，生成數據如何污染下一代模型的訓練集，導致模型逐漸失去對原始數據的正確感知，出現模型崩潰現象。

很快，豆包的做法引發了社會輿情的反彈以及其他AI大模型廠商的警覺。一方面，豆包自己進行了整改與優化。另一方面，谷歌下架了所有豆包的詞條內容。此外，國內各大互聯網公司也針對AI生成的詞條以及低質量的語料修改了算法。

原文標題 : 字節跳動大模型：實用，實用主義

標題：字節跳動大模型：實用，實用主義

地址：https://www.utechfun.com/post/396551.html

鄭重聲明：本文版權歸原作者所有，轉載文章僅為傳播信息之目的，不構成任何投資建議，如有侵權行為，請第一時間聯絡我們修改或刪除，多謝。

標籤：字節跳動豆包

上一篇:道路覺醒後，蘿卜快跑們正迎面狙擊出租車行業

下一篇:微軟和蘋果放棄OpenAI董事會觀察員席位

您現在的位置：首頁人工智能

字節跳動大模型：實用，實用主義

猜你喜歡

您現在的位置： 首頁 人工智能

猜你喜歡

您現在的位置：首頁人工智能