大模型在先,小模型在後,生成式AI試水工業,如何破局數據短缺/可靠性不足?

2024-12-11 18:40:32 編輯： robot

導讀作者：彭昭（智次方創始人、雲和資本聯合創始合夥人）物聯網智庫原創這是我的第352篇專欄文章。在我之前的文章《從LLM大模型到SLM小模型再到TinyML,這個領域有望增長31倍》中，曾經提到小...

作者：彭昭（智次方創始人、雲和資本聯合創始合夥人）物聯網智庫原創

這是我的第352篇專欄文章。

在我之前的文章《從LLM大模型到SLM小模型再到TinyML,這個領域有望增長31倍》中，曾經提到小模型SLM的進展，如今這一領域正在悄然發生突破。

小模型SLM，可以看作是大模型LLM的“迷你版”，它們雖然體型小巧，但卻擁有着不容小覷的能力。相比動輒數百萬、數十億參數的GPT-4等大模型，SLM的運行規模要簡單得多。經過優化的SLM能夠高效處理較爲簡單的任務，而無需消耗大量計算資源。

如今，小模型正朝着產業落地的方向大步邁進，它們不再是實驗室裏的“玩具”，而是正在成爲各行各業的“生力軍”。

科技巨頭們已經嗅到了小模型的無限潛力，紛紛加入這場爭奪未來的战局。

微軟、谷歌和蘋果等公司均已入局小模型SLM，例如微軟的Phi-3、谷歌的Gemma和蘋果的Foundation Models。

最近，微軟更是推出了適用於工業領域的全新AI小模型。

通過與拜耳、羅克韋爾自動化、西門子等公司合作，這些小模型使用行業特定數據進行了預先訓練，可用於處理一些關鍵問題。這就像是爲每個行業量身定制了一套“智能裝備”，讓AI的力量深入到每個生產環節，提升效率、優化流程、創造價值。

今天這篇文章，我們將一起探索小模型在工業應用中的最新進展，了解它們所蕴藏的機遇與挑战。

小模型與AI代理：下一個熱門？

首先，我們需要進一步理清大模型與小模型之間的區別，如上圖所示。

小模型之所以“小”，不僅僅在於其參數數量較少，更重要的是，小模型常常在小型數據集上進行微調，以優化其在特定任務上的性能，使其更加契合業務工作流的需求。

小模型的強項在於處理特定任務和工作流程。盡管參數數量有限，但當使用定制數據集針對特定領域任務進行微調時，小模型完全能夠勝過大型通用模型。針對特定任務的訓練可以減輕幻覺現象，增強問題解決能力。

資源效率是小型語言模型的另一大亮點，對於希望跨越各種平台和設備實施AI解決方案的企業來說，它們尤其具有吸引力。小模型使企業能夠以更簡單的基礎架構和更低的成本，充分享受AI帶來的優勢。據測算，小模型可以節省高達75%的模型訓練成本和超過50%的總部署成本。

在小模型的基礎上，我們還可以玩出許多新花樣。

一些公司將小模型用於AI代理工作流中，其中多個小模型通過通信和協作來執行更加復雜的任務。

例如，在AI代理工作流中，第一個AI代理可能負責規劃如何解決任務，第二個AI代理進行必要的研究，第三個AI代理執行該計劃，第四個AI代理則驗證和評估結果。這種協作方式展示了這些模型如何協同工作，以提高生產力並實現更復雜的結果。

說到這裏，我來解釋一下什么是AI智能代理。

AI代理的官方定義是一種能夠感知環境、進行決策和執行動作的智能體。

簡而言之，ChatGPT不屬於AI代理，但战勝李世石的AlphaGo可以被視爲AI代理。

目前，我們與AI的交互形式基本上都是先輸入指令，AI模型根據指令內容做出響應，這就導致我們每次都需要提供有效的提示詞，才能達到預期效果。

而AI代理則不同，它被設計爲具有獨立思考和行動能力的AI程序。我們只需要提供一個目標，比如寫一個遊戲、开發一個網頁，AI代理就會自主生成一個任務序列，开始工作。

讓我們通過幾個例子來更深入地理解AI代理。

一個初級的AI代理，是家中的空調自動控制系統。它遵循簡單的“如果-那么”原則運行：如果溫度低於設定點，則打开空調暖風；如果溫度高於設定點，則關閉空調暖風。這種基礎的AI代理雖然簡單，但在日常生活中已經發揮了重要作用。

而高級的AI代理，如DeepMind的AlphaGo，則是專爲復雜的圍棋而設計的人工智能系統。AlphaGo展示了非凡的學習能力，最終擊敗了世界冠軍圍棋選手。這一裏程碑式的事件，彰顯了AI代理在處理復雜任務方面的巨大潛力。

就像俄羅斯套娃一樣，多個初級和高級的AI代理可以建立起分層代理系統。

分層代理是一種將復雜任務分解爲更簡單的子任務，並以分層結構組織起來的AI系統。這種方法允許代理管理不同級別的抽象，更有效地處理復雜問題。

分層代理的一個典型例子，就是亞馬遜Amazon Go商店的“Just Walk Out”技術。該系統在運作中表現出了清晰的層級結構：

頂層：整體商店管理和庫存跟蹤

中級：客戶跟蹤和行爲分析

低級：產品識別和交互檢測

最低級別：傳感器數據處理和融合

依靠這些AI代理的協同工作，Amazon Go以“不用排隊，拿了就走”的全新購物體驗，在零售行業和科技圈吸引了無數目光。

上述案例只是冰山一角，AI代理在實際應用中的想象力正在被激發。

小模型與Copilot覆蓋超100家公司12萬用戶

在了解了小模型與AI代理的概況後，讓我們一起探索微軟與工業企業的最新合作。

本次嘗試微軟小模型的企業包括拜耳、羅克韋爾自動化、西門子、Sight Machine等。

以羅克韋爾自動化爲例，該公司從操作層面开始嘗試應用小模型。在人機界面可視化平台FactoryTalk Optix的食品和飲料版本中，他們運用小模型，將行業特定功能的優勢帶給制造業一线工人，支持食品和飲料領域的資產故障排除。AI模型爲工廠車間工人和工程師提供關於特定制造流程、機器和輸入的實時建議、解釋和知識。

另一款產品FactoryTalk Design Studio是羅克韋爾自動化專注於系統設計的雲原生軟件，它使用Copilot增強了PLC代碼創建和用戶管理。工程師能夠使用自然語言提示執行產品指導、代碼生成、故障排除和代碼解釋等任務，使系統設計更快、更直觀。

同樣，西門子正在爲CAD解決方案NX X軟件引入全新的Copilot。該軟件利用經過調整的AI模型，使用戶能夠通過自然語言提問、獲取詳細的技術見解並簡化復雜的設計任務，實現更快、更智能的產品开發。

目前，包括舍弗勒和蒂森克虜伯自動化工程在內的100多家公司正在使用西門子工業Copilot來簡化流程、解決勞動力短缺問題並推動創新。12萬名西門子工程軟件用戶，現在有機會通過生成式AI驅動的助手來提升工作效率。

作爲敢於喫螃蟹的用戶，蒂森克虜伯自動化工程公司是首家使用Copilot的公司，並且計劃從2025年初开始，在該公司的全球體系內普及應用。

根據實踐，工程師現在可以在30秒內創建可視化面板，並生成代碼，根據經驗這些代碼僅需20%左右的調整就可以直接應用。這簡化了工作流程，減少了人工工作量，解決了熟練勞動力短缺的問題。

就具體場景而言，蒂森克虜伯使用AI輔助开發用於生產汽車電池的自動化系統。例如在一台電池質量的檢測裝置中，傳感器、攝像頭和測量系統集成在一起，監控多個階段的電池單元質量，進行復雜的評估以檢測超出設定閾值的放電。Copilot通過自動執行多個任務，如數據管理、傳感器配置、電池質量檢測等各個重復性步驟，輔助操作員增強了該設備的運行效果。

Copilot：工業生成式AI的現實角色

在工業領域，“想到”和“做到”完全是兩碼事，生成式AI的工業價值尚需被驗證。

古人雲“欲得其利、先知其弊”，要充分發揮小模型的優勢，就必須了解它的局限性。

生成式AI的弊端在於可靠性較低，具有不可解釋性，只能應用於對可靠性要求不高的場合。

小模型的缺點則是精度有限，無法捕捉大規模和復雜數據集中的細致特徵和關系，預測能力相對較弱；此外，它們難以應對復雜問題。這些弊端決定了小模型只能承擔輔助思考的角色，爲我們提供更多可行性方案作爲選擇，而最終決策仍需由人來做。

在實際應用過程中，也是挑战重重。

工業領域廣泛使用AI的最大障礙是數據的缺失。由於工業涉及設備、工藝、操作、環境等多重因素影響，獲取大量且多維的全面數據難度很大。大多數制造商雖然坐擁數據，但其中大部分是時間序列數據，沒有得到適當的標准化，甚至無法用於AI的模型訓練。

數據問題的本質，很多時候不單純是技術問題，而是人員和流程問題。不成熟的數據管理流程、始終存在的OT與IT鴻溝，以及缺乏對小模型的理解，都是導致生成式AI目前僅限於一次性試點或實驗的因素。

因此，目前生成式AI在工業領域更多以虛擬助手的功能存在，並將會持續較長時間。

這些AI虛擬助手爲工廠車間操作員提供指導，或幫助控制工程師編寫PLC代碼。鑑於當前吸引和留住工廠車間人才的挑战，Copilot能夠輕松幫助合成實時信息或提供編碼輔助。

過去，工程師需要熟悉雲平台、傳感器、物聯網、人工智能和不同類型的時間序列和工程數據，而生成式AI則允許工程師輕松進行數據查詢、可視化和工作流程，而無需擔心復雜性。操作員可以按需提出問題，而不需要了解軟件。

許多制造企業配備了復雜的系統和更多的自動化設備，但那些擁有幾十年經驗與知識的資深員工卻逐漸離开了職場，制造商們很難找到年輕的技術人員來維護現有的系統。Copilot可以成爲幫助縮小這一差距的工具。

例如，工業軟件企業Aveva的AI助手可以幫助操作員回答以下問題：上個月車間的最大產量是多少？或者爲什么這台壓縮機本周效率較低？杜邦公司也已經开始使用生成式AI來幫助工程師更快地找到信息，生成式AI可以節省數小時的手冊搜索時間。

這些Copilot就像操作員的專家顧問，根據需要建議如何提高產量、降低能耗等。從某種意義上說，它們與原有的“專家系統”並沒有本質區別，是否採納這些建議取決於操作員。

面臨的挑战也與過去的“專家系統”大同小異：如何建立對顧問的信任。工廠中的新配方經常出現，如果沒有適當的更新和維護，專家系統也會很快過時。另一個風險在於，如何檢查和驗證所有生成式AI的輸出。AI不會說“我不知道”；如果沒有數據，它可能會進行編造。

寫在最後

在這個萬物互聯、智能無處不在的時代，小模型和生成式AI正在工業領域掀起一場革命。從制造車間到產品設計，從運營優化到故障診斷，AI正在重塑着每一個環節。

然而，我們也必須清醒地認識到，工業領域的AI應用之路並非坦途。數據缺失、可靠性不足、解釋性有限等挑战，都在提醒我們要謹慎對待這項新興技術。盡管如此，我們仍然有理由對未來保持樂觀。

隨着技術的不斷進步和企業實踐的深入，人機協作將更加緊密，小模型和生成式AI也將在工業領域釋放出更大的潛力。

參考資料：

《忍不住談談工業大模型》，作者：郭朝暉，來源：蟈蟈創新隨筆

《Microsoft Introduces New Adapted AI Small Language Models for Industry》，作者：Colin Masson，來源：ARC Advisory Group