撰文 | 吳坤諺
編輯 | 吳先之
2010年,世界上首款量產純電車型日產汽車(Nissan)聆風上市的時候,沒人能想到日產汽車公司乃至整個日本汽車行業都將在十余年後的今天淪爲陪跑。
類似這樣由領跑者淪爲追隨者的案例並不鮮見,正如在大模型領域,意欲竊取百度、科大訊飛等一衆大模型先行者勝利果實的字節跳動。
衆所周知,百度、科大訊飛是國內大模型賽道中先聲奪人的代表玩家,早在去年上半年便上线網頁測試版搶佔用戶心智,以期在正式面向公衆服務的時候能快速積累用戶。然而據QuestMobile近日發布的數據,2023年11月,文心一言、豆包與訊飛星火的日活分別是155.4萬、124.6萬、71.9萬。
不難看出,相比於早在2023上半年便上线網頁測試的百度與科大訊飛,8月才开啓邀測的豆包跑出了更快的增長速度。
甚至到了2024年2月19日,豆包在iOS免費榜上排名49,而文心一言排名爲157,訊飛星火則排名400开外,類GPT應用的前三把交椅之間已然存在不小的差距。
在今年1月的2024年年度全員會上,字節跳動CEO梁汝波提到內部對GPT的討論始於2023。短短一年內,基於雲雀大模型的AI應用矩陣已經形成,似有復現曾經其作爲爆款應用工廠之勢。
豆包的勝利屬於抖音
字節一度在業內享有“App工廠”之稱,這源於其算法推薦機制下,集中資源與頭條系流量大水漫灌的打法,可以“熱啓動”新的獨立應用,快速積累用戶。
時過境遷,互聯網紅利見頂催生的聚合超級App不斷擠壓獨立App的生存空間,讓字節逐漸難以持續打造爆款App,但“算法+流量”的傳統打法仍不失其效果。如字節於2023年上线的新遊《晶核》與《星球:重啓》均基於抖音的流量,通過這個打法快速撐起用戶與營收規模。
同樣的啓動路徑自然可以復現到大模型應用上。更重要的是,國內大模型賽道無論是模型層還是應用層,都未能出現如ChatGPT、Character.AI一般站穩生態位的玩家,“大力出奇跡”的打法似乎與時下亂局正合適。
據Tech星球報道,有消息人士透露豆包的月活已於去年12月增長至200萬,2024年1月份則在此基礎上翻了一番。我們亦自相關人士處了解到,豆包的月內平均日活已經完成了對文心一言的反超。
誠然,互聯網做的一直是注意力的生意,這是爲何字節這套“老打法”能再獲战果的原因。但在注意力極爲稀缺的當下,流量還不足以讓字節做到後發突圍。
要知道,業內對AI應用落地難的共識是其難以挖掘新的使用場景與功能,這同樣是豆包延續其“爆款”生命力的關鍵所在。就創新性來看,我們能輕易在豆包目前的產品形態中找到Character.AI這位前輩的影子。
豆包與Character.AI一般主打多樣化的智能體,除應用內置的“豆包”、“AI圖片生成”、“編程助理”等覆蓋高頻需求的智能體外,用戶亦可自行無代碼創建。
智能體的玩法可以較好地覆蓋用戶低頻需求,產品設計上偏向拓展C端規模。其他功能如語音交互以及AI聲音創建是不錯的亮點,但總體並未跳脫出Character.AI已被驗證的產品框架。相比之下,隔壁文心一言顯得更爲成熟,不僅同樣引入了智能體玩法,同時還在發力建設AI交流社區以及商業化。
我們體驗發現,文心一言App已將“社區”設置爲一級入口,社區中的UGC內容以文心一言生成的AIGC圖文爲主,並加入了移動互聯網常見的贊評交流系統。此外,百度還在文心一言4.0訂閱制付費的基礎上推出了“靈感幣”作爲補充,用戶可通過分享、拉新與充值的方式獲取更強的模型能力。這一系列變化,都指向了商業化。
反觀豆包目前尚不見商業化動作,社區建設同樣未曾上馬。至於文心一言目前在數據上(如iOS下載量)不如豆包好看,或是二者的流量分發效率不可同日而語的緣故。但不可否認的是,這恰好印證了此前外界對字節AI大模型進展較慢的固有印象。
早在2023年末,今年便被業內公認爲是AI應用爆發的元年,多方向出擊的大廠與創業公司的草台班子同台角力,看似領先的豆包無疑面臨着更爲激烈的競爭壓力。
還得靠內容支棱起來
上文提到,豆包於模型能力產品化上的創新不多。除流量分發外,其規模化的速度還需自其他方面嘗試歸因。我們體驗後發現,豆包在頂層設計上與其他廠商有明顯區別。
首先,持續佔據抖音站內“廣告位”的豆包已在生態上與抖音完全打通,用戶不僅可以通過抖音號快捷注冊登錄,更是可以在向豆包提問時,通過AI搜索抓取字節生態內部分標題中帶有關鍵詞的內容。智能體的回答會較多參考抓取圖文、視頻的內容,這也導致豆包在這類問題的回復上往往需要較多時間。
搜索的引入一定程度上緩解了對話模型“說胡話”的問題,另一方面,一般字節系內容唯有在自家生態內才能搜索,內容的呈現本就是其互聯網服務的一部分。
這么看,字節的產品設計其實是一種對用戶的心智教育——文案、繪畫等高頻需求塑造了用戶對大模型應用的工具型感知,而字節通過提供趣味內容玩法,推動用戶感知向其擅長的內容服務靠攏。換句話說,字節希望將豆包打造成一款偏向娛樂的產品,而非純粹的工具產品。
上文提到的AI聲音創建同樣是爲增加應用趣味性而設的功能,用戶可以通過錄制音頻來創建AI聲音,由此催生了多樣的交互玩法,例如模仿明星聲音並創建明星的智能體,以及春節期間足以擊穿所有年輕人的財神。
談及內容,字節可就支棱起來了。字節的內容體系經歷了移動互聯網由圖文轉向視頻的歷史進程,無論是昨日的頭條系還是今日的抖音系都積攢了海量的信息,這不僅可以作爲模型訓練的“養料”,如今更是融入了模型應用的產品服務中。
進一步說,不少喪失時效的長尾內容的價值存在被再次激活的可能,這是內容平台進軍大模型的優勢之一。
將大模型接入自家生態的條件也不是只有字節獨有,百度便早已將文心一言接入了多個產品线,如一度爲業內所遺忘的百度文庫。
只是上述兩者在具體玩法上可以說是背道而馳,字節選擇讓由豆包抓取生態內內容,讓生態服務模型應用,而百度選擇讓應用接入模型能力,讓模型反哺生態。
字節更在意的是如何將豆包打造成模型時代的爆款,而百度更在意的是如何通過模型來挖掘既有業務的潛力。不同的做法各有側重,這也一定程度上解釋了豆包如今在消費端的強勢表現。
字節的AI版圖
豆包僅是字節AI版圖中的一隅。
除了豆包這個面向國內C端的AI對話應用外,字節旗下還推出了AI工具集小悟空(原悟空搜索)、AI bot平台扣子與抖音情緒機器人等,且以上應用大多都已推出海外版。可以看出,發力AI的不僅有爲創新AI應用而創建的新部門Flow,還包括多條既有業務线的AI重構。
字節最初涉足大模型領域的嘗試是火山引擎於去年6月推出的大模型服務平台“火山方舟”,隨着豆包與其他一系列AI應用逐漸打出市場聲量,意味着字節邁出了B端MaaS之外的第二只腳。
如果說以豆包爲代表的智能體對話類應用聲量漸起,對應了字節AI战略版圖的一面,那么更具技術深度與商業前景的文生視頻則是其圖景的另一面。
近日,OpenAI推出的文生視頻大模型Sora點燃了AI創投圈,能夠根據文本提示創建詳細的視頻,擴展現有視頻中的敘述以及從靜態圖像生成場景,最長能生成60秒視頻的Sora將AI軍備競賽的战火帶至文生視頻領域。
就在Sora推出前後,字節的兩個動作耐人尋味:近日,原抖音集團CEO張楠宣布辭去集團CEO一職,未來把精力聚焦在剪映的發展上;另一方面,界面新聞報道稱在Sora發布前,字節便已推出可通過文本控制生成視頻中人物或物體的動作的模型產品Boximator,一度爲市場解讀爲Sora的“競品”。
將曾帶領字節系短視頻業務完成從0到1的張楠接手剪映,意味着其很可能就這款輔助視頻創作工具進行“二次創業”。實際上,早在本次人事調動前,剪映便推出了AI寫真、漫畫等新功能。降低普通人視頻創作門檻的產品設計與文生圖的應用开發堆砌下,剪映本次文生視頻的轉向並不出人意料。
另一方面,盡管字節方面回應稱Boximator目前還無法作爲完善的產品落地,但這並不妨礙其可以被視作字節文生視頻業務的一塊拼圖。
由於Sora生成視頻的60秒時長恰好切中字節內容護城河中的短視頻,其上述兩個動作也多爲市場解讀成一種針對性的預判防御動作,防止Sora搶奪平台既有創作工具的用戶。“預判”這一因素好似去年十二月衝擊國內遊戲產業的新規發布前,字節便提前鳴金收兵一般,頗有昨日重現的色彩。
實際上,字節未必是預判到了具體情況,而是對自身發展的前景與桎梏有着明確的感知。
就目前情況看,圖片、文案、代碼等基礎需求其實早已是昨日黃花,於此之上的模型應用之爭可以說是亂成一鍋粥,但又決不出個高低來。早在去年下半年,賽道玩家們便有意向prompt工程、多輪對話記憶與長文本上發力,其原因恰是基礎需求實際上並不能很好地體現模型水平與能力。
基礎需求不過是字節可以“補課”追趕領域,而更具技術深度的文生視頻,才稱得上是大模型賽道競爭的勝負手。Sora的發布不過是2024年模型能力演進主线中的一位吹號人,告訴大家視頻時代已至。
或許字節跳動已經追上了國內大模型賽道的進度,但在世界範圍看,它還是一個追隨者。
原文標題 : 大模型的耐力遊戲
標題:大模型的耐力遊戲
地址:https://www.utechfun.com/post/338424.html