寫下這篇的起因,是前不久的一件事。
我們參與了一個大模型與行業結合的主題論壇。活動結束之後,來自行業主辦方的一位代表跟我們交流時卻說:“你們一直在說大模型。到底什么是大模型?多大才算大?爲什么不能用小模型?”
這一系列問題又一次讓我們意識到,智能化的供需雙方很多時候根本處在兩套話語體系。你這邊Transfomer、Agent的說了半天,那邊可能還在好奇大模型這三個字到底是怎么來的。
這種隔膜,在AI時代尤爲嚴重。因爲AI技術涉及的鏈條更長,做算法的、做雲的、做硬件的、做IT解決方案的,以及最後买單的,大家可能在各說各的,誰也沒打算真正理解誰。
今天,各家都在說產業大模型、行業大模型。確實從技術邏輯上看,很容易發現大模型能夠給很多行業帶來巨大的生產力釋放,而從技術路线上看,中國企業對智能化的接受度更高、需求更強烈。大模型走向產業實現數實融合,是中國AI最具特色的一條脈絡,在數字中國的大背景下具有極強的宏觀战略意義。
但在實踐中,這條路卻充滿了挑战與誤解。
畢竟AI算法公司做toB,十家有九家做不成。在大模型toB的新機會窗口前,我們首先要確定產業究竟需要怎樣的大模型?
產業大模型,就不是一種模型
AI公司做大模型結合行業,最大的誤區在於搞不清供需關系。
誠然,目前行業對大模型的認可與接納程度已經比較好,但智能化項目依舊是一個絕對的买方市場。技術供應商需要去適配最終用戶的需求、能力、背景,甚至溝通話術和商業習慣。
但由於做AI大模型的公司,湧入了大量互聯網領域的人才和資金。互聯網的供需邏輯是單點供應對大量需求,我有一招鮮天下湧進來。而大模型在很多行業的適配又是很容易就能想到的。比如工廠需求配料分析,銀行需要投資分析,那我的大模型不是都能分析嗎?
於是,在這樣的“風口思維”下,很多AI公司陷入了一個巨大的誤區:他們認爲我有大模型,各行業的客戶都應該來找我。我推出兩三個行業的案例,其他行業都應該認可。我的這個大模型哪裏都能用,所以它就叫產業大模型。
無論這些AI從業者是真的相信大模型等於產業萬金油,還是僅僅是故意吹成這樣。在產業客戶看來,這一幕就等於胡說八道。他們會覺得,金融業用的技術,關我煤礦什么事?如果有一種食品,說是貓能喫牛能喫人也能喫,你敢喫嗎?
產業需要大模型做的第一件事,就是不要籠統的天差地別的各個行業歸納爲“產業”兩個字就結束了。即使在某個行業內,大模型都僅僅能解決行業的一個或幾個問題,更不可能有一種模型能夠“包治百業”。
做IT的都知道,有產品更要有服務,懂技術更要懂行業。但做AI的企業,尤其是拿着熱錢湧入大模型賽場的企業,普遍對產業需求的差異性缺乏了解和尊重。
當然,不同行業對大模型的需求也有共通之處。比如對基礎的對話、CV、多模態能力。但更多的情況下,每個行業的只能用意愿、基礎數字能力,乃至安全需求、時延需求、運維需求都不相同。在今天的階段,一種大模型能夠在具體行業內復制推廣已經非常不容易,更別想一口喫下幾個甚至幾十個行業。
產業智能化,優先級永遠是產業大於智能化。
不提硬件和工程化,約等於瞎耽誤功夫
很多做數字化、智能化的企業,在看了客戶環境之後會奇怪這么一件事:客戶花了大錢买回來的東西,其實就是很簡單的軟件封在一個盒子裏,然後按照行業要求做了點按鈕、UI之類的東西。甚至這些軟件很多都是國外很古早的开源軟件進行再封裝,技術上早就落後了。這時他們會感嘆,行業客戶的錢可真好騙啊。
可是問題來了,如果我們換個角度思考這個問題,要是沒有這層封裝,企業要怎么用呢?難道一家工廠、一座礦山、一片林場,要招來和培養一大堆雲計算、AI算法層面的人才?而且要讓這些數字化人才指導整個企業的生產、運營和銷售?這顯然是不靠譜的。
所以,一個有點反常識的事實是,相比於天花亂墜的先進技術,行業用戶往往更在乎那層“殼”。那層殼就說硬件化和工程化,是將技術能力按照最終的使用需求進行封裝、管理和維護。雖然最後組裝出來的東西可能很難用,可能不先進,但對於行業用戶來說,有的用,員工能學會,才是智能化的最重要條件。
在討論行業大模型時,今天也經常會陷入這個誤區。從業者往往過分關注算法層的領先性、國際性,跟參數規模和測試紀錄較勁,把目光聚焦在軟件上。但行業需要大模型做的,是跟此前的數字系統較勁,跟使用成本較勁,跟操作門檻較勁。這就需要大模型考慮硬件環境、網絡環境、存算資源、操作系統,甚至考慮部署環境的電力供應、溼度、溫度。
產業大模型要做的第二件事,是必須兼顧硬件適配和工程化問題。
大模型能否落地,都在說要找准場景。但什么是場景?最後能起作用的那個地方才叫場景。
絕大部分企業,都不是IT爲導向。甚至大部分企業根本無法派專人去仔細了解什么是大模型。這個事情在漫長的時間裏都無法改變。
山不會過來看你,所以你要去看山。
很多人把大模型比作一座金礦,那么訓練大模型僅僅是挖到金礦,通過工程化方法,講大模型融入到行業已有的數字化基礎設施,才是把金礦運出山。
專家下工廠,終究要不得
很多AI廠商無論是在給客戶講故事,還是面向公衆做傳播,總是會提起這么一段:你們不要擔心,我們有專家有博士後扎根行業。下工廠,下農田,一駐守就是幾個月。
如果你是大模型的潛在行業用戶,那么這個故事聽聽就算了。專家駐廠確實是真的,但那個廠極大概率不是你的廠。
事實上,AI專家親臨產業一线,是縮短行業需求與大模型供給之間的有效路徑。這也是一個產業智能化必經的發展過程。
但這個過程必然也只能是暫時性的,不可能長久。試想一下,如今大模型正在風口浪尖,專家們都是什么身價?一個專家組入駐現場,就這個薪資成本哪家實體企業能撐得住?
AI企業所宣稱的專家駐廠,其實是在做案例、做測試。一般都是和行業內的頭部客戶合作,廠商愿意以虧損爲代價把模型跑通,觀察有哪些具體問題。
專家可以下廠,但專家肯定不能經年累月駐守一家又一家工廠。這是AI廠商進入某行業時的標准動作,但往往會有意無意被理解爲一個常規動作,可真要只能依賴專家下廠來推廣大模型,那么AI永遠也無法落地,因爲這個成本誰也承受不起。
產業大模型要做的第三件事,是技術具有行業內的低門檻可復制性,不能大量依賴人工進行訂制化合作。
尤其需要注意的是,目前階段大中型企業在智能化上的投資愈發謹慎,試錯成本不能過高。實驗性與不確定性太強的大模型落地方案,在目前階段已經很難得到大客戶認同,更遑論成千上萬的中小客戶,更是不可能依賴重人工投入的方式來推動。
總結一下,產業大模型目前階段的落地挑战有三點:
1.AI廠商總把大模型想象爲萬金油,但行業需要的是理解和專注。
2.AI廠商總是關注算法創新,但行業需要的是工程化和可操作。
3.AI廠商大量宣傳依靠人才能力跑通的個案,但行業需要的是低成本和可復制。
大模型落地產業,正是旭日東升時,但也要有意識去清掃一些積雪,而回到用戶界面,往往就能找到更多問題的答案。
原文標題 : 產業,到底需要什么大模型?
標題:產業,到底需要什么大模型?
地址:https://www.utechfun.com/post/258453.html