中國AI今天的問題，是大模型又多又亂

2023-11-21 18:40:05 編輯： robot

導讀 OpenAI的开發者日活動後，GPTs模式引發了新一輪的AI熱潮，开發者調用過分火爆，甚至導致OpenAI服務器一度宕機。隨後，花式把玩GPTs的經驗，以及圍繞這種新形態的巨大爭議开始湧現。中國的I...

OpenAI的开發者日活動後，GPTs模式引發了新一輪的AI熱潮，开發者調用過分火爆，甚至導致OpenAI服務器一度宕機。隨後，花式把玩GPTs的經驗，以及圍繞這種新形態的巨大爭議开始湧現。中國的IT從業者、軟件开發者與AI工程師也積極參與討論，迎來了一場新的AI狂歡。

但在這種氛圍下，卻有一種沉默顯得像個顯眼包。那就是絕大多數大模型公司，似乎都沉默了。爲了模仿類GPT的大模型，中國AI圈用了一年時間，雨後春筍般打造了上百個大模型。但其中能夠誕生明星應用，能夠推動產品創新，甚至能夠擁有規模化用戶的似乎都寥寥無幾。當OpenAI的飛輪效應顯現，這些大模型公司就有種越是模仿差距越大的感覺。於是幹脆不去追新的熱點，埋頭把眼前能做的先做完。

記得今年年初的時候，社交網絡和媒體都在討論中國能否有大模型？

當時我們說過，這其實是個僞命題，因爲中國早就有大模型。而在ChatGPT爆火之後，中國AI遇到的問題一定不是大模型太少，而是大模型過剩。

今天，這種問題开始浮現了出來。此刻中國AI行業最大的問題，就是大模型太多，而且還挺亂。

摩肩接踵的大模型

中國到底有多少AI大模型？經過一年的井噴式發展，這已經變成了一筆糊塗账。上半年的時候，答案大概是幾十個。時間來到11月，有人說是一百多個，有人說是二百多個。總之，中國此刻必然是全世界擁有大模型最多的國家，遠遠超過美國。

但是，這一百多個大模型有人用過嗎？有人對比、評測過嗎？恐怕沒有。因爲除了幾個頭部大模型形成了用戶規模外，其中大部分存在於开源社區，還有一部分只存在通稿裏。

這就像什么呢？其實很多人不知道，根據相關數據，中國有2600萬足球人口，同樣居世界第一。我們無從考證數據從何而來，反正周圍踢足球的人看着是不多，而國足的成績有目共睹。

爲什么會出現這么多大模型呢？

首先是今年大模型賽道好，機會難得。雖然科技板塊的VC市場非常低迷，但在其他互聯網創投項目普遍失效，虛擬貨幣被嚴格限制的情況下，AI大模型成爲今年近乎唯一的故事。因此即便熱錢不多，但還是集中湧向了大模型創業。

其次，與很多人設想的不同，大模型創業並沒有真正意義上的高門檻。一旦以股權、期權等方式吸引到了合適的人才，大模型創業公司過多的費用支出。相比於其他科技領域有產品研發、用戶推廣、硬件化等燒錢選項，在擁有大量开放數據集、免費工具的情況下，僅僅是訓練大模型並沒有過高的成本門檻，並且所謂大模型項目，往往一個科研團隊就可以支撐，不需要像互聯網創業公司搭建較爲復雜的業務體系。

此外，還有一種“刷業績”式的大模型，極大程度增加了大模型數量。這種一般是高校、科研機構相關團隊，選報大模型方面課題更容易獲得立項。其結項結果發布後，大模型數量就又增加了一個。或者是大型企業上級要求做大模型，於是IT部門會根據开源的模型框架搭建一個出來，即使效果不佳，落地困難，也要進行對內對外宣傳。

賽道好、成本低、需要完成任務，這幾種動力，導致中國大模型越來越多，且產生效率越來越快。

但問題在於，足球人口規模可能確實很重要，但更重要的是有一支能踢進世界杯的球隊。

沒有希望的窄賽道

那么有人或許要問了。大模型數量說難道不能成爲優勢嗎？我們靠數量出奇跡，說不定數量一多就能選出拔尖的來？

這恐怕並不現實。因爲從種種理由來看，今天龐大的大模型規模，都是不可能持續存在。通稿打造類GPT模型而擠入下一個科技時代的美好想法，已經將AI大模型變成了一條沒有希望的窄賽道。

我們可以來正視這樣幾個問題：

1.大模型的數量多，其實和大模型本質背道而馳。

提起大模型，我們會說它的優點是模型的泛化性、高魯棒性，繼而帶來了“智能湧現”效果。我們總是驚嘆OpenAI的成績，就是因爲GPT系列始終在深度挖掘模型的泛化性。也就是說，大模型的優勢就是一個頂一群，用一個模型代替一堆模型，結果反而出現了數量過剩的大模型，這與大模型初衷南轅北轍，並且浪費了海量的社會資源。

2.大模型是底層技術，底層技術的玩家不可能很多。

僅僅以AI开發爲例，模型之上還有AI芯片、AI框架。在過去幾年，這些領域也有很多廠商布局，但最後大多不了了之。AI芯片無法出貨，AI框架無人問津，能夠剩下的只有頭部一兩家而已。大模型也是同樣的道理，這是一個注定洗牌到存量很少的賽道。

大模型，距離开發者很遠。

絕大多數初創大模型，都會選擇开源吸引开發者的模式。但現實情況是，這些模型無論是與國外开源大模型，還是國內頭部大模型相比，都沒有實際競爭力，無法形成規模化的开發者聚合效應。這些大模型普遍是开源時大力宣傳一波吸引關注，但开發者實際體驗後馬上遇冷。

4.大模型，距離用戶很遠。

在可見的場景中，絕大多數大模型都缺乏商業化支撐，是這個賽道最大的問題。對應大模型創業型企業來說，一开局就是最艱難的局面。後來廣受詬病的機器視覺公司，在开局階段還有智能安防市場作爲支撐。但大模型公司擁有的只是算法，甚至連一條可行的商業化通道都找不到。

這些問題，導致堆積了巨大數量的大模型賽道开始變得並不美好。它今天的情況是，說算法，各個創新；說參數，各個龐大；說調用，根本沒人用；說商業，根本沒去想。

模型一多，亂象也多

大模型一多，產業賽道开始熱絡起來，也必不可免出現一些問題。這就是我們說的，大模型不僅有點多，還有點亂。

由於目前階段，有一股“大模型用不用不重要，先要擁有大模型”的思潮。因此就开始有各種方式降低大模型的开發成本，通過話術誇大價值，甚至硬蹭大模型熱度，把不是大模型技術的項目包裝成大模型，進而導致大模型圈子裏，开始出現良莠不齊、魚龍混雜的態勢，我們可以列舉其中的幾種：

1.打榜刷分型大模型。由於大模型數量龐大，且實現思路基本一致，這就導致不同公司之間的差異化微乎其微。而爲了凸顯自己的差異化與領先性，目前通用方式是硬造一個技術術語，然後宣傳通過這項技術自身項目刷新了某榜單紀錄，在某測試中跑出了多少分。

事實上，大部分榜單都只測試模型的某個維度，可以進行針對性調參。打榜刷分並不難，且有比較大的操作空間。類似的，社區开發者打多少顆星，發了多少篇頂會，也都是慣用的包裝方案。

2.結項爲主型大模型。有很多用作課題結項，或者企業數字化成果結項的大模型。評審結束，結項成功，开源开放，這三條做到就是它們的生命終點。這類大模型不考慮應用場景與後續更新，有某種朝生夕死的精神特質。

3.動輒开源型大模型。軟件开源當然是大勢所趨，但隨着這幾年中國开源事業的興旺發展，AI模型开源似乎變成了某種“時尚”。加上一些企業更愿意將大模型的开源與免費作爲流量聚攏工具。开源，逐漸成爲了低質量、低維護大模型的遮羞布。

4.冒名頂替型大模型。大模型火了之後，开始有公司打起了蹭熱點的主意。於是，用並非標准預訓練大模型技術冒充大模型，甚至幹脆把古早的對話機器人、應用軟件包裝成大模型的案例屢見不鮮。用大模型的瓶子，裝其他老酒，也成爲了一門生意。

5.套殼變身型大模型。最近，一些創業公司套殼國外开源模型的事件引起爭議。其實業界類似手法並不少見，將开源大模型進行改寫和包裝，搖身一變，成爲自研大模型的例子非常多。

這些大模型隊伍裏的妖魔鬼怪，也紛紛可以通過發明術語、加強定語的方式，來宣傳自己的創新能力和差異化。最終導致把真正的技術創新，淹沒在了一系列的“僞裝創新”當中。

中國AI之春，在去掉90%的大模型之後

如果我們看美國的大模型產業結構，會發現它處在一個每層數量差異不大的金字塔結構裏。即OpenAI一家獨大，谷歌、微軟、Meta、X保持持續競爭力，此外還有20幾個較爲常用，开發者群落比較活躍的大模型。

當然咱們不是說一定要照搬美國，但從中大概可以看見一個科技大國，在目前情況下大模型產業體量是什么。

中國大模型，已經在短時間內發展出了遠遠超過本身應有存量的大模型。數量過於龐大的大模型，一方面浪費了極大的研發、算力，以及數據資源；另一方面也蕴藏了一場並不會太久的“危機”。

在資本泡沫相對冷卻之後，我們很容易看到這樣的情況：忽然之間，衆多大模型开始停止更新，緊接着大模型領域的公司大量倒閉。伴隨着資本退場，員工待遇下降等問題开始發生，於是媒體开始唱衰大模型寒冬，社交媒體上开始冷嘲熱諷AI這門技術。

這種行業猛然轉冷，大概率會給真正具有競爭力、創新能力的中國AI企業帶來巨大的麻煩。

但是請記住，這並不是AI不行了，而是這些AI公司和大模型項目本來就不行。

這不是AI寒冬，而是中國AI的春天剛剛要真正开始。產業優化重組後的大模型產業形態，才是真正能發揮出中國在應用創新、產品打磨、產業智能化落地等領域的優勢。

在中國，相對良性的大模型產業形態，應該是有5家左右可以互相競爭的主流大模型，1到2個能夠進行底層技術創新，保持全球競爭力的大模型體系，同時有一系列开源大模型作爲補充，以及一些學術領域的大模型作爲AI for sience的支撐。此外，還要具備較爲完善的大模型配套設施，包括AI芯片、AI計算、深度學習开發框架、AI开發工具，並且這些領域都有較高的自主化程度。換言之，必須要淘汰今天超過90%的大模型。

在這些底層軟硬件基礎之上，應該有大量創業公司、AI开發者去探索C端和B端的大模型落地。在大模型與行業結合的垂直領域，組成推廣和復制行業大模型的產業生態；在主要的C端市場，比如大模型+辦公、大模型+娛樂、大模型+信息獲取方面，湧入成千上萬家公司，形成互聯網經濟之後的AI經濟奇跡。

而從“百模大战”中能夠留到那時的只有三種公司：具備核心技術創新的、形成平台型產業鏈的以及能夠快速找到商業出口，形成正向資金循環的。

我們依舊篤信，有一天AI技術上會出現新的抖音、微信、office，甚至更多此前無法想象的東西。

但今天絕大多數的大模型，結局恐怕只能是躺在歷史空隙與开源平台上，成爲大時代的小腳注。

原文標題 : 中國AI今天的問題，是大模型又多又亂

標題：中國AI今天的問題，是大模型又多又亂

地址：https://www.utechfun.com/post/293983.html

鄭重聲明：本文版權歸原作者所有，轉載文章僅為傳播信息之目的，不構成任何投資建議，如有侵權行為，請第一時間聯絡我們修改或刪除，多謝。

標籤： AI 大模型

上一篇:北京低碳農業協會6個分會籤署減排固碳聯合行動方案

下一篇:OpenAI要散？超500員工威脅集體辭職要求創始人回歸組織罷免者後悔

您現在的位置：首頁人工智能

中國AI今天的問題，是大模型又多又亂

猜你喜歡

您現在的位置： 首頁 人工智能

猜你喜歡

您現在的位置：首頁人工智能