產業，到底需要什么大模型？

2023-09-06 18:40:20 編輯： robot

導讀寫下這篇的起因，是前不久的一件事。我們參與了一個大模型與行業結合的主題論壇。活動結束之後，來自行業主辦方的一位代表跟我們交流時卻說：“你們一直在說大模型。到底什么是大模型？多大才算大？爲什么不能用...

寫下這篇的起因，是前不久的一件事。

我們參與了一個大模型與行業結合的主題論壇。活動結束之後，來自行業主辦方的一位代表跟我們交流時卻說：“你們一直在說大模型。到底什么是大模型？多大才算大？爲什么不能用小模型？”

這一系列問題又一次讓我們意識到，智能化的供需雙方很多時候根本處在兩套話語體系。你這邊Transfomer、Agent的說了半天，那邊可能還在好奇大模型這三個字到底是怎么來的。

這種隔膜，在AI時代尤爲嚴重。因爲AI技術涉及的鏈條更長，做算法的、做雲的、做硬件的、做IT解決方案的，以及最後买單的，大家可能在各說各的，誰也沒打算真正理解誰。

今天，各家都在說產業大模型、行業大模型。確實從技術邏輯上看，很容易發現大模型能夠給很多行業帶來巨大的生產力釋放，而從技術路线上看，中國企業對智能化的接受度更高、需求更強烈。大模型走向產業實現數實融合，是中國AI最具特色的一條脈絡，在數字中國的大背景下具有極強的宏觀战略意義。

但在實踐中，這條路卻充滿了挑战與誤解。

畢竟AI算法公司做toB，十家有九家做不成。在大模型toB的新機會窗口前，我們首先要確定產業究竟需要怎樣的大模型？

產業大模型，就不是一種模型

AI公司做大模型結合行業，最大的誤區在於搞不清供需關系。

誠然，目前行業對大模型的認可與接納程度已經比較好，但智能化項目依舊是一個絕對的买方市場。技術供應商需要去適配最終用戶的需求、能力、背景，甚至溝通話術和商業習慣。

但由於做AI大模型的公司，湧入了大量互聯網領域的人才和資金。互聯網的供需邏輯是單點供應對大量需求，我有一招鮮天下湧進來。而大模型在很多行業的適配又是很容易就能想到的。比如工廠需求配料分析，銀行需要投資分析，那我的大模型不是都能分析嗎？

於是，在這樣的“風口思維”下，很多AI公司陷入了一個巨大的誤區：他們認爲我有大模型，各行業的客戶都應該來找我。我推出兩三個行業的案例，其他行業都應該認可。我的這個大模型哪裏都能用，所以它就叫產業大模型。

無論這些AI從業者是真的相信大模型等於產業萬金油，還是僅僅是故意吹成這樣。在產業客戶看來，這一幕就等於胡說八道。他們會覺得，金融業用的技術，關我煤礦什么事？如果有一種食品，說是貓能喫牛能喫人也能喫，你敢喫嗎？

產業需要大模型做的第一件事，就是不要籠統的天差地別的各個行業歸納爲“產業”兩個字就結束了。即使在某個行業內，大模型都僅僅能解決行業的一個或幾個問題，更不可能有一種模型能夠“包治百業”。

做IT的都知道，有產品更要有服務，懂技術更要懂行業。但做AI的企業，尤其是拿着熱錢湧入大模型賽場的企業，普遍對產業需求的差異性缺乏了解和尊重。

當然，不同行業對大模型的需求也有共通之處。比如對基礎的對話、CV、多模態能力。但更多的情況下，每個行業的只能用意愿、基礎數字能力，乃至安全需求、時延需求、運維需求都不相同。在今天的階段，一種大模型能夠在具體行業內復制推廣已經非常不容易，更別想一口喫下幾個甚至幾十個行業。

產業智能化，優先級永遠是產業大於智能化。

不提硬件和工程化，約等於瞎耽誤功夫

很多做數字化、智能化的企業，在看了客戶環境之後會奇怪這么一件事：客戶花了大錢买回來的東西，其實就是很簡單的軟件封在一個盒子裏，然後按照行業要求做了點按鈕、UI之類的東西。甚至這些軟件很多都是國外很古早的开源軟件進行再封裝，技術上早就落後了。這時他們會感嘆，行業客戶的錢可真好騙啊。

可是問題來了，如果我們換個角度思考這個問題，要是沒有這層封裝，企業要怎么用呢？難道一家工廠、一座礦山、一片林場，要招來和培養一大堆雲計算、AI算法層面的人才？而且要讓這些數字化人才指導整個企業的生產、運營和銷售？這顯然是不靠譜的。

所以，一個有點反常識的事實是，相比於天花亂墜的先進技術，行業用戶往往更在乎那層“殼”。那層殼就說硬件化和工程化，是將技術能力按照最終的使用需求進行封裝、管理和維護。雖然最後組裝出來的東西可能很難用，可能不先進，但對於行業用戶來說，有的用，員工能學會，才是智能化的最重要條件。

在討論行業大模型時，今天也經常會陷入這個誤區。從業者往往過分關注算法層的領先性、國際性，跟參數規模和測試紀錄較勁，把目光聚焦在軟件上。但行業需要大模型做的，是跟此前的數字系統較勁，跟使用成本較勁，跟操作門檻較勁。這就需要大模型考慮硬件環境、網絡環境、存算資源、操作系統，甚至考慮部署環境的電力供應、溼度、溫度。

產業大模型要做的第二件事，是必須兼顧硬件適配和工程化問題。

大模型能否落地，都在說要找准場景。但什么是場景？最後能起作用的那個地方才叫場景。

絕大部分企業，都不是IT爲導向。甚至大部分企業根本無法派專人去仔細了解什么是大模型。這個事情在漫長的時間裏都無法改變。

山不會過來看你，所以你要去看山。

很多人把大模型比作一座金礦，那么訓練大模型僅僅是挖到金礦，通過工程化方法，講大模型融入到行業已有的數字化基礎設施，才是把金礦運出山。

專家下工廠，終究要不得

很多AI廠商無論是在給客戶講故事，還是面向公衆做傳播，總是會提起這么一段：你們不要擔心，我們有專家有博士後扎根行業。下工廠，下農田，一駐守就是幾個月。

如果你是大模型的潛在行業用戶，那么這個故事聽聽就算了。專家駐廠確實是真的，但那個廠極大概率不是你的廠。

事實上，AI專家親臨產業一线，是縮短行業需求與大模型供給之間的有效路徑。這也是一個產業智能化必經的發展過程。

但這個過程必然也只能是暫時性的，不可能長久。試想一下，如今大模型正在風口浪尖，專家們都是什么身價？一個專家組入駐現場，就這個薪資成本哪家實體企業能撐得住？

AI企業所宣稱的專家駐廠，其實是在做案例、做測試。一般都是和行業內的頭部客戶合作，廠商愿意以虧損爲代價把模型跑通，觀察有哪些具體問題。

專家可以下廠，但專家肯定不能經年累月駐守一家又一家工廠。這是AI廠商進入某行業時的標准動作，但往往會有意無意被理解爲一個常規動作，可真要只能依賴專家下廠來推廣大模型，那么AI永遠也無法落地，因爲這個成本誰也承受不起。

產業大模型要做的第三件事，是技術具有行業內的低門檻可復制性，不能大量依賴人工進行訂制化合作。

尤其需要注意的是，目前階段大中型企業在智能化上的投資愈發謹慎，試錯成本不能過高。實驗性與不確定性太強的大模型落地方案，在目前階段已經很難得到大客戶認同，更遑論成千上萬的中小客戶，更是不可能依賴重人工投入的方式來推動。

總結一下，產業大模型目前階段的落地挑战有三點：

1.AI廠商總把大模型想象爲萬金油，但行業需要的是理解和專注。