大模型競速2024:服務、應用、MaaS

2024-01-05 18:40:03    編輯: robot
導讀 撰文 | 吳坤諺 編輯 | 吳先之 年末的大模型賽道靜悄悄。 既沒有電商領域的drama反轉,也沒有遊戲行業那般的連續地震,除了行業媒體的零星解讀外,相對突破賽道圈層而進入大衆視野的消息,還是字節跳...

撰文 | 吳坤諺

編輯 | 吳先之

年末的大模型賽道靜悄悄。

既沒有電商領域的drama反轉,也沒有遊戲行業那般的連續地震,除了行業媒體的零星解讀外,相對突破賽道圈層而進入大衆視野的消息,還是字節跳動與百度兩家頭部與海外大模型相互套殼的新聞。

或因大模型在商業化天平的兩端都未曾誕生足夠引領潮流的產品,即使國內“百模大战”熱鬧了一整年,但預想中的“iPhone時刻”仍未到來,以致於市場對相關消息出現了脫敏現象——大模型的推出與後續的刷榜難以再獲取市場關注。

在落地成果出現之前,市場進入了明顯的冷靜期。但不可否認的是,國內的創新仍在發生。過去一年,我們見證了國內大模型從無到有再到枝繁葉茂,其中文領域能力持續爬坡,以及各玩家在商用落地道路上的諸多探索。

說白了,我們踏上這條道路也僅僅一年時間。得與失的討論更應該集中在“得”而非“失”之上。

頭部公司帶領的三次轉向

亞裏士多德提出的第一性原理認爲,萬事萬物都有一個根基性命題或假設,不能缺省,也不能被違背。以此來淺析當下的大模型行業,其數據、算力、能力等維度的攀升顯然是題中之義。

因此,領跑中國大模型速度的是頭部科技企業,數據與算力儲備爲他們踏入新時代風口提供了不小的先發優勢。

據不完全統計,國內大模型數量已達200以上。共同締造“中國速度”的先行者是百度、阿裏、字節等頭部互聯網公司。先行者效應下,他們的一舉一動也一定程度上牽動行業的發展方向。

自百度三月發布文心一言起,直至年中時期如騰訊、京東、華爲等大廠搭上大模型的班車,這段時間可以說是國內大模型賽道的混沌期。

所謂混沌,是初生的無序狀態。平台類大廠、互聯網大佬與高校科研團三股勢力在ChatGPT3.5的爆點後迅速達成“生成式AI代表未來”的共識,以搗鼓出自家的大模型爲第一要務。彼時的業內語境中,訓練模型被戲稱爲“煉丹”,然而煉的什么丹、給誰喫、有什么用以及怎么用,大多都還處於盲目的狀態。

有人向往AGI的星辰大海,有人希望重塑千行百業,有人僅僅只是炒作拉股價。

這段時期內,大模型的中文領域能力大部分不及GPT3.5,其價值停留在紙面上,有待發掘。自用戶層看,“松鼠鱖魚法”與不少开放測試的大模型一直重復初次回答的糟糕體驗亦是混沌期的小小注腳。

年中,距離开源“英雄”LLaMA爲業界提供了模型結構、訓練方法等標准答案已有4個月,夠多個大廠復用其成果。這進一步縮小了國內模型能力代差,GPT3.5的裏程碑被越來越多的玩家觸及,通用大模型發展進入相對平穩的瓶頸期

與此同時,GPU供不應求下的算力緊張、大模型廠商的造血內需推動將大模型落在實處的清風逐漸吹起。

在商業化落地不明朗,成本、周期難把控等問題下,大幹快上通用模型被描繪爲春秋筆法。此後兩個月是行業大模型的集中發布期。騰訊雲的MaaS解決方案、京東產業大模型與華爲盤古大模型爲賽道的垂直轉向定下基調。

一時間,金融、工業、教育等主要產業的垂直模型如雨後春筍般出現。

在PMF(產品市場匹配)的第一性要求下,主流範式是只取基礎模型的理解能力與少量對話、推理能力“一瓢飲”,調用大模型時代前的AI模型與數據庫獲取結果,最後再由大模型“組裝結果”。

這一模式雖相較基礎模型的萬卡規格相去甚遠,亦一定程度上緩解幻覺問題,但精調、部署的基本流程下依舊剛需數百張GPU和不短的時間成本。因而其更像是廠商對大模型落地的迫切與客戶企業的降本需求“一拍即合”的權宜之計。

此外,一個值得思考的問題是AI生產力工具,爲我們帶來的究竟是降本還是增效?

針對不同發展階段的企業,AI工具的能力偏向將顯著影響接受度和滿意度。通過SFT(精調)行業大模型的範式以快速落地看,企業購买大模型能力並未給業務帶來本質上的增效,而是爲既有AI工具和模型配上一個大腦。

換言之,此前的行業大模型更偏向於降本而非增效,更適用於收縮期的企業,尤其是已建立起AI工具體系的大型企業。那么行業大模型相對更易向上滲透,抓住大B而非小B的現狀也就不難理解了。

此後,垂直模型的技術底座持續演進,目前以調用向量數據庫和RAG(檢索增強生成)兩個“外掛”爲中心軸,不過這是後話了。

今年9月,大模型管理辦法實施,聚光燈漸漸有從產業向用戶轉移的趨勢。直至以PC爲首的消費電子賽道抱上了大模型前進的大腿,既是載體也是入口的智能設備,爲大模型在C端的商業落地找到全新場景。

自脫離混沌期起,國內大模型玩家就一同走上了產品化的道路。但總體來看,早在3月末便提出的主线任務——MaaS還處於未發力的狀態。就像早期的行業大模型一般,賽道向外兜售的只是模型能力,而非模型服務。

兩字之差,指向大模型未能從技術價值轉換爲生態價值。做個不算恰當的比喻,在AI高速公路上,各廠商只能象徵性地建幾所收費站。

目前基礎模型底座能力無人稱王,大家同台競技之下無人能站穩生態高位。整體情況導向了兩條2024年的大模型掘金之路——模型服務創新與應用。

大廠創企,機會均等

逐鹿九州,是大模型廠商試圖衝擊生態位置的現狀。

只是目前看來,追求模型能力已不是衝擊高位的最優解,就像Sam·Altman所言:“擴大模型規模的收益在遞減”。

首當其衝的是愈發緊張的AI算力,據Omdia統計數據,今年Q3也就是英偉達發布GPU禁令前,騰訊、百度、阿裏三家購入100系GPU的數量分別爲50K、40K與25K,三者相加也不及微軟和OpenAI其一。

另一方面,OpenAI雖給出 Scaling Law(模型能力雖訓練計算量提升的擴展定律)來解釋大模型之“大”,但包括算力、人力、電力等在內的成本側已無法容忍過多資源投入僅爲百尺竿頭更進一步,這一點基本已是業內共識。

大力不能出奇跡,意味着大廠先發的算力、規模等優勢正在逐漸消弭。

從AI infra來看,規模效應遞減的根源在於算力緊張與數據敝帚自珍。但自技術層面,更多問題已經成爲南牆:有毒內容與幻覺尚未有解法、AI前沿爲商業公司把持後,开源程度日益遞減等。

參數量的頂級規格已經停留在萬億量級許久,玩家們开始思考如何通過巧思而非大力來推動AI行業向前。

一條路徑是“小而美”,曾有傳言稱GPT4是由十數個MOE小模型聚合而成,MOE也成爲當下微軟、谷歌等頭部企業競逐的新領域。尤其是其和端側設備的結合,新時代AI硬件有着足夠的想象空間。

大模型的軟硬件生態從結合到協同的發展速度令人咂舌。今年初,大模型語境中的模型訓練還是萬卡集群,年末時候,高通驍龍8 Gen3便展現了百億參數模型的端側運行能力。國內已有OPPO、vivo、小米等手機廠商推出端側模型,其服務與應用或將於2024年全面爆發。

另一條路徑是Long Context,模型能力突破艱難的情況下,讓模型底座發揮作用的慣常範式是SFT,然而訓練成本掣肘,長文本的Prompt有可能在向量數據庫與檢索增強生成的基礎上徹底消磨精調的存在。

回首創企,智譜AI、月之暗面、百川智能等創業獨角獸也攜AgentTuning(智能體增強)、Long Context、RAG等獨特的模型服務創新嶄露頭角。

創業公司的“破壞性創新”能力早在此前的商業史上便屢有驗證。由“生成式AI”代表未來這一基本共識發散开來的不同技術路线昭示着更多樣化的AI未來圖景。

重塑开發生態

OpenAI塑造了2023年AI賽道關於大模型的共識,追趕的旋律就此开始譜寫。此後的GPT4以及GPT4V的出現更讓人深感大山似乎不可逾越。

但近來發生的兩件事情,終歸給到國內玩家們希望。

先有《The Verge》報道字節跳動因使用ChatGPT的API以訓練自家大模型,因而遭OpenAI予以“封號”處理;後有谷歌最新發布的Gemini-Pro承認在中文領域訓練中使用了百度文心一言的數據。

不出意外,重復造輪子的基礎模型之爭於此踩了一下剎車,而數據集的價值再次被放大。隨着推特、Reddit 等移動平台關閉免費的API接入點,在不遠的未來,或許通過數據採集器搜集平台數據用於AI訓練的 Pretrain 模式將徹底成爲歷史。

進一步說,字節套殼GPT亦或是谷歌套殼文心一言,本質上是模型架構的趨同與數據價值的躍升。那么中文高質量數據實際上也是國內大模型的護城河。

在此基礎上,我們更不需要擔心模型層會落後於海外過多。反而是在應用層面,百花齊放才是AI時代應有的面貌。如此來看,李彥宏一直反復嘮叨,“我們不需要這么多基礎大模型,我們需要更多應用”的說法有其合理性。

應用本身是商業化落地的終極載體之一,更重要的是應用的开發過程——率先構築完善AI Native應用开發生態的基礎模型廠商將搶佔生態價值的高位,推動自家大模型的價值從技術價值轉爲生態價值。

典型的案例便是蘋果稅,或是手遊行業衆所周知的安卓渠道商。只是移動生態早已固化,遠非當下“百模大战”的混亂可比。

如果我們沿用上文的比喻,當下大模型廠商加碼模型能力,試圖做AI高速公路收費站,或許現在更需要的是收費站中間的服務站。完善的應用开發工具鏈所構築的开發生態能極快加速爆款應用的出現時間。

12月20日,百度副總裁侯震宇將AI原生應用开發新範式定義爲AI Native 應用生態的關鍵組件之一,百度亦再次迭代應用开發工具鏈並推出了AppBuilder,正如文心一言發布時一般搶先了一個身位。

可以預見的是,我們也將很快看到除百度外的玩家通過新場景、新系統共同打造新的开發生態。

即使AI應用开發生態的必然性前置會讓應用爆發的時間節點稍爲後置,但考慮到今年大模型的“中國速度”,2024年基本可以確定是AI應用噴湧之年。

目前來看,國內AI社交、AI遊戲的發展已初具規模,更多賽道正在接受AI的改造,重塑應用的生產力與生命力。AI加入後是否會變更賽道既往的商業模式,是產品經理迫切需要解決的Konw How 。

我們確定,2023年的結束並非大模型周期的結束。或許我們仍會爲GPT等海外大模型的能力提升而感到壓力,但我們也能還之以應用層的創新。而不再時刻盯着OpenAI的中國大模型,也將真正走出屬於自己的道路。

       原文標題 : 大模型競速2024:服務、應用、MaaS



標題:大模型競速2024:服務、應用、MaaS

地址:https://www.utechfun.com/post/314030.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡