大模型“四小龍”，能否跨越深淵？

2024-01-26 18:40:04 編輯： robot

導讀一張名爲《大模型的深淵》的圖，在去年廣爲流行。喫瓜群衆驚詫地發現，原來絕大多數大模型，都擠在深不見底的層級,“宣稱自己快要落地的”“再等等決定啥時候落地的”“什么落地不落地的”“怎么還有這么多沒聽說...

一張名爲《大模型的深淵》的圖，在去年廣爲流行。喫瓜群衆驚詫地發現，原來絕大多數大模型，都擠在深不見底的層級,“宣稱自己快要落地的”“再等等決定啥時候落地的”“什么落地不落地的”“怎么還有這么多沒聽說過的大模型啊”……

時至今日，國產大模型數量已經達到200多個，“深淵”更深。

其中，很多低水平重復造輪子的大模型，無法滿足個人和產業的使用需求，發布之後無人問津，已經不可能在業內翻起什么波瀾了。而那些真正具備技術價值和商業價值的大模型，也如同“潛龍在淵”，逐漸顯露出“一飛衝天”的苗頭。

上一波2015年左右开始的AI創業浪潮，以CV計算機視覺技術爲主導的初創企業中，號稱“CV四小天鵝”的商湯科技、曠視科技、雲從科技、依圖科技，也被譽爲中國的“AI四小龍”，成爲那一個AI繁榮周期中的標志性創新企業。

那么，由大模型开啓的新一輪繁榮周期中，自然也會有“潛龍在淵”。誰會成爲類似“AI四小龍”這樣的潛力股呢？答案基本藏在這三個梯隊裏。

大模型“四小龍”的一鱗半爪

業內流傳一句話：小創新靠大廠，大創新靠小廠。從昔日的DeepMind到去年的OpenAI，這些年輕、新銳的技術團隊，回歸創新本源，一次又一次給業界帶來顛覆性的變化，成爲從業者和投資人眼中的“潛力股”。

所謂大模型的“潛龍”，有兩個基本條件：

一是“潛”，相比谷歌、微軟、英偉達、百度、騰訊、阿裏等科技巨頭，成立時間更短、隊伍更加年輕化，組織效率和靈活度更高。

二是“龍”，有着不輸給大廠，甚至超越大廠的技術創新性，基礎模型是自研的，並且是L0級的通用大模型，可以爲行業大模型、垂類大模型提供底座，具備向多個產業轉化的潛力，有望帶來高增長和高投資回報率。

雖然機器視覺公司也都推出了大模型，技術實力不俗，但並不算是AI新面孔。而使用开源LLaMA 架構的零一萬物，以及被大廠收購不再獨立競爭的光年之外，雖然夠“新”，但發展遇到較大的轉折點。所以這些企業及其大模型，我們就不放在此次討論。

總體來說，有三類大模型企業，目前都得到了國內外知名投資機構或行業客戶的支持，擁有較高的技術認可度與商業轉化潛力，可以被看作是“大模型四小龍”的預備役。

1.明星派

明星創始團隊，具備在工業界或學術界的知名度和影響力，打造的大模型一出世，便憑借“明星效應”，備受業界關注。

包括，由前搜狗公司CEO王小川創立的百川智能（2023年3月，擁有多種參數的Baichuan系列大模型）；由前商湯研究院副院長閆俊傑創立的Minimax（2021年12月，擁有ABAB 大模型）；由中國最早從事中英機器翻譯領域的研究者之一、2023年ACL Fellow周明博士創辦的Langboat瀾舟科技（2021年6月，擁有通用大模型孟子）。

2.技術流

相比“明星效應”，技術流更強調技術實力，其中典型代表是智譜AI。作爲一家清華系初創公司，智譜AI在2019年成立時就把OpenAI當作對標，將實現AGI通用智能作爲目標，是中國最早啓動預訓練模型研發的科技公司之一。智譜AI最新發布的基座大模型GLM-4，在一系列評測中的表現也被認爲逼近了OpenAI的GPT-4。

3.務實派

被寄予厚望的明星派、技術流，都是“高高在上”的，從業務/商業土壤上生長出來的務實派大模型，也可能憑借落地應用而闖出一條路。比如2023年問世的“天工”大模型，由昆侖萬維自主研發，大模型AIGC與昆侖萬維的搜索、遊戲、社交、娛樂等業務的結合，快速進入應用周期，也讓昆侖萬維成爲闖入大模型領域的一匹黑馬。

需要說明一下，三個類別是看“最長板”，並不意味着其他賽道的能力不高。

擁有明星創始團隊的大模型，性能也可能並不遜色於技術流；擁有強大基座模型的技術流，也可能牽起強悍的運營隊伍，帶動產品落地；而務實派是“根據釘子造錘子”，但錘子要是不夠硬，啥也砸不下去，所以技術能力也得過硬。

凝視大模型的“商業化”深淵

對標“AI四小龍”，可能並不讓大模型企業很高興，反而是憂慮更多。

以計算機視覺爲核心的“AI四小龍”前期融資能力很強，但普遍遭遇了商業化的艱難探索，面臨盈利難、市值下降等困擾。而大模型的落地“深淵”，背後是更加漫長的商業化之路。

但是，逃避、諱莫如深，是無法打消投資人、市場和用戶的顧慮的。無論大模型企業是否愿意凝視深淵，深淵一直都在凝視着大模型。

直面大模型的“商業化”深淵，相比上一輪AI，有三新一舊：

三新：新環境、新規模、新要求。

簡單來說，大模型企業面臨着更加嚴苛的融資環境，隨着全球流動性衰減，科技企業的高估值都很難保持，龐大如谷歌都在裁員“降本增效”，融資難度更大了，比如智譜AI的融資水平就明顯不及當年的商湯科技。

同時，大模型又是一個重投入的行業，基座模型的技術競賽，還遠遠沒到終結的時候，持續向上探索意味着長期燒錢，需要的資金規模更大。而吸取了上一輪AI投融資經驗的投資人，面對大模型也格外冷靜，對初創企業的自身造血盈利能力提出了更高的要求。

一舊：AI標品化依舊很難。

南橘北枳，在中國做AI，照搬OpenAI是絕對不行的，要看到鐵一般的事實：中國toC市場對AI等軟件產品的付費意愿不高，監管嚴格，很難做，真要做也要配備龐大的團隊去確保安全合規，投入並不小。

toB市場也有很大的差異，國內企業大多不信任SaaS模式，更傾向於私有化部署，行業市場分散，中小客戶衆多，需求紛繁復雜，高薪的算法工程師到一线做一個幾十萬的項目很常見。

至於toG市場，智能化項目競爭激烈，而且事多錢少利潤薄，上一輪機器視覺公司基本在做自動駕駛、智慧城市、安防等業務，都掙的是辛苦錢。一般來說，CV計算機視覺類項目費用，是比NLP自然語言處理類高的，所以大語言模型想要靠項目制獲得高客單價，也是很困難的。

究其原因，ToB/ToG市場的AI項目，大多以解決方案式落地，政企機構更希望打包式引入AI、雲、IoT等軟硬件，針對自身打造定制化方案，AI產品無法以標准化、模塊化的形式快速交付，前期要投入很高的成本。

從這個角度看，整體投入更大、單個項目收益更小，大模型的商業化挑战，比上一波機器視覺公司更嚴峻。

那么，“大模型四小龍”，會重蹈覆轍嗎？

龍躍於淵，大模型盈利出路在哪裏？

悟已往之不谏，知來者之可追。面對AI商業化難題，也不必悲觀，事實上，我們看到大模型“四小龍”預備役們，大多能开始吸取經驗开新局。我們也發現了一些共同點：

共同點一：降本，但不“增笑”。

對內“節流”，提高人效。相比上一輪AI創業熱潮中“高薪挖算法/科學家”，這些大模型“潛龍”從一开始就會注重“人效比”。

此前科技行業的高流動性、高估值，也催生了“獨角獸”們隨意擴張，反而造成了大量的低效現象，比如硅谷“神員工”精通各種編程語言，原來是把工作外包給多個中國工程師，幾年都沒被發現。這種環境也導致創新大幅度收縮，初創企業招人成本奇高。

而這波大模型創業熱潮中，企業對於人員擴張都是比較謹慎的。周明曾對媒體說過，开始創業時團隊只有他自己，後來擴展到5個人，慢慢开始訓練模型，以一個“輕量化”的團隊做出的孟子模型，未來應該長期穩定在百人的規模。百川智能、智譜AI也是類似的思路。

對外降本，提升大模型企業的盈利潛力。幫助企業和用戶“節流”，降低應用大模型的成本。很多客戶的痛點是，用大模型的成本壓力很大，希望大小模型結合，來提高投入產出比。比如百川、智譜AI都推出了多種參數的大模型，來綜合不同需求。

共同點二：聚焦toB，重視現金流。

這些大模型企業從一开始就聚焦在toB市場，智譜AI的CEO張鵬、瀾舟科技創始人周明都曾明確表示過，優先發展toB企業服務業務。

從數字化到智能化，傳統AI廠商需要從零开始做用戶教育，去講述AI技術降本增效的價值。與之相比，大模型的認知度和接納度，都是非常高的。各行各業對生產力的渴求、對應用AI的共識，都非常充沛。這給大模型企業帶來了非常好的增長基礎。

百煉智能發布的《大模型招標需求分析簡報（2023年1月-11月)》顯示，7月起，隨着國內130個大模型相繼問世，大模型招標需求量开始呈現明顯上升趨勢。11月迎來增長高峰，需求量較前月翻至近3倍。其中選擇投入10萬-50萬預算進行小規模嘗試的企業最多，同時也有不少以國央企爲代表的企業开始釋放百萬級項目預算。

如前所說，toB的錢也未必好賺。企業客戶雖然付費意愿比C端用戶高，但toC應用可以標品化、大規模地吸引用戶付費，而toB智能化項目卻需要定制化，投入更大。此前機器視覺公司也曾想將AI模型跨場景、泛化應用，但發現現實世界的商業模式依然是強定制，成本居高不下。

這個問題，在大模型創業者中有比較廣泛的共識，也都在積極探索解法。百川智能CEO王小川曾對媒體透露，要突破toB定制化問題，通過可配置、可調整的搜索增強知識庫，以產品化的方式，通過不同的產品組合，來解決客戶的定制化需求。

共同點三：廣交朋友，積極开源。

“定制化”之所以成爲企業的天然需求，一個主要原因是AI落地業務場景，是從零开始的，AI要和業務一起磨合才能發揮作用，很多場景是無法用一個通用產品來解決的。智能化是一門長期的慢生意，是離不开生態合作夥伴，去深入行業，做大量定制化工作的。

這些年，我們團隊實地走訪了不少AI+工廠、AI+養豬、AI+巡檢、AI+煤礦、AI+碼頭等智能化項目，最常見的一個場景就是：AI企業的科學家、算法工程師、產品運營人員、項目經理等各色人等，有的在田間地頭碼頭倉庫，一待就是幾個月，去了解基層人員的工作需求，去從頭設計作業流程。

而智能化往往也伴隨着“去人化”，有的時候一线工作人員也會不理解、不配合，大大延緩項目進度。有一年冬天，某煤礦智能化團隊在陝北某場站調研時，工作人員不想搭理他們，就故意不开暖氣爐，想讓他們大冷天的自己知難而退。還有一次，在一家養豬場，管理方希望用智能攝像頭來實時感知豬的體溫，防範豬瘟等傳染病，但算法性能一直提不上去，最後技術人員在現場反復調研，發現是因爲豬皮太厚了，導致體溫識別准確率下降……

不難看到，這些十萬、幾十萬的中小微企業的小項目，可能客單價比不了大B/政府類客戶，但數量多、規模大，以基礎大模型作爲底座，進行定制化开發，可以極大地提高基座模型廠商的使用率，吸引更多夥伴/ISV服務商去打造商業版。

吸引行業夥伴，百川智能、智譜AI、昆侖萬維、瀾舟科技都相繼开源了數個模型。

但我們都知道，开源容易，做生態難。一個大模型开源之後，生態繁榮不起來，沒有开發者來持續貢獻、打造商業版，無法形成正循環。

要吸引开發者，一是基座模型的能力還是要過硬，理解分析邏輯不能有硬傷。奧特曼就曾經說過，GPT-4的很多問題會在GPT-5得到解決，希望开發者基於AGI通用人工智能去設計業務。換句話說，更強大的新模型，可能會將舊模型的商業價值一筆勾銷，讓开發者徹底白幹。所以，开發者一定會選擇將時間精力放在那些最先進的基座模型上，避免被卷得太快。

此外，需要良好完備的工具棧。大模型要用好，軟件也要做一定的適配和改造，則考驗的是大模型廠商的工程化能力，軟件是否對开發者友好。而“四小龍”中比較多初創公司，工程團隊在規模、人才、經驗、積累等方面可能與BAT這類成熟企業有差距。比如任務調度、代碼可讀性、技術文檔、標准數據集等，減輕开發者和夥伴們的負擔，共同把大模型用好。

無論是曾經輝煌的“AI四小龍”，還是正在崛起的“大模型四小龍”，這些企業用銳利的技術和昂揚的理想，一次又一次地推高創新的“天花板”，是中國科技不可或缺的一支力量。