大模型在先,小模型在後,生成式AI試水工業,如何破局數據短缺/可靠性不足?

2024-12-11 18:40:32    編輯: robot
導讀 作者:彭昭(智次方創始人、雲和資本聯合創始合夥人)物聯網智庫 原創 這是我的第352篇專欄文章。 在我之前的文章《從LLM大模型到SLM小模型再到TinyML,這個領域有望增長31倍》中,曾經提到小...

作者:彭昭(智次方創始人、雲和資本聯合創始合夥人)物聯網智庫 原創

這是我的第352篇專欄文章。

在我之前的文章《從LLM大模型到SLM小模型再到TinyML,這個領域有望增長31倍》中,曾經提到小模型SLM的進展,如今這一領域正在悄然發生突破。

小模型SLM,可以看作是大模型LLM的“迷你版”,它們雖然體型小巧,但卻擁有着不容小覷的能力。相比動輒數百萬、數十億參數的GPT-4等大模型,SLM的運行規模要簡單得多。經過優化的SLM能夠高效處理較爲簡單的任務,而無需消耗大量計算資源。

如今,小模型正朝着產業落地的方向大步邁進,它們不再是實驗室裏的“玩具”,而是正在成爲各行各業的“生力軍”。

科技巨頭們已經嗅到了小模型的無限潛力,紛紛加入這場爭奪未來的战局。

微軟、谷歌和蘋果等公司均已入局小模型SLM,例如微軟的Phi-3、谷歌的Gemma和蘋果的Foundation Models。

最近,微軟更是推出了適用於工業領域的全新AI小模型。

通過與拜耳、羅克韋爾自動化、西門子等公司合作,這些小模型使用行業特定數據進行了預先訓練,可用於處理一些關鍵問題。這就像是爲每個行業量身定制了一套“智能裝備”,讓AI的力量深入到每個生產環節,提升效率、優化流程、創造價值。

今天這篇文章,我們將一起探索小模型在工業應用中的最新進展,了解它們所蕴藏的機遇與挑战。

小模型與AI代理:下一個熱門?

首先,我們需要進一步理清大模型與小模型之間的區別,如上圖所示。

小模型之所以“小”,不僅僅在於其參數數量較少,更重要的是,小模型常常在小型數據集上進行微調,以優化其在特定任務上的性能,使其更加契合業務工作流的需求。

小模型的強項在於處理特定任務和工作流程。盡管參數數量有限,但當使用定制數據集針對特定領域任務進行微調時,小模型完全能夠勝過大型通用模型。針對特定任務的訓練可以減輕幻覺現象,增強問題解決能力。

資源效率是小型語言模型的另一大亮點,對於希望跨越各種平台和設備實施AI解決方案的企業來說,它們尤其具有吸引力。小模型使企業能夠以更簡單的基礎架構和更低的成本,充分享受AI帶來的優勢。據測算,小模型可以節省高達75%的模型訓練成本和超過50%的總部署成本。

在小模型的基礎上,我們還可以玩出許多新花樣。

一些公司將小模型用於AI代理工作流中,其中多個小模型通過通信和協作來執行更加復雜的任務。

例如,在AI代理工作流中,第一個AI代理可能負責規劃如何解決任務,第二個AI代理進行必要的研究,第三個AI代理執行該計劃,第四個AI代理則驗證和評估結果。這種協作方式展示了這些模型如何協同工作,以提高生產力並實現更復雜的結果。

說到這裏,我來解釋一下什么是AI智能代理。

AI代理的官方定義是一種能夠感知環境、進行決策和執行動作的智能體。

簡而言之,ChatGPT不屬於AI代理,但战勝李世石的AlphaGo可以被視爲AI代理。

目前,我們與AI的交互形式基本上都是先輸入指令,AI模型根據指令內容做出響應,這就導致我們每次都需要提供有效的提示詞,才能達到預期效果。

而AI代理則不同,它被設計爲具有獨立思考和行動能力的AI程序。我們只需要提供一個目標,比如寫一個遊戲、开發一個網頁,AI代理就會自主生成一個任務序列,开始工作。

讓我們通過幾個例子來更深入地理解AI代理。

一個初級的AI代理,是家中的空調自動控制系統。它遵循簡單的“如果-那么”原則運行:如果溫度低於設定點,則打开空調暖風;如果溫度高於設定點,則關閉空調暖風。這種基礎的AI代理雖然簡單,但在日常生活中已經發揮了重要作用。

而高級的AI代理,如DeepMind的AlphaGo,則是專爲復雜的圍棋而設計的人工智能系統。AlphaGo展示了非凡的學習能力,最終擊敗了世界冠軍圍棋選手。這一裏程碑式的事件,彰顯了AI代理在處理復雜任務方面的巨大潛力。

就像俄羅斯套娃一樣,多個初級和高級的AI代理可以建立起分層代理系統。

分層代理是一種將復雜任務分解爲更簡單的子任務,並以分層結構組織起來的AI系統。這種方法允許代理管理不同級別的抽象,更有效地處理復雜問題。

分層代理的一個典型例子,就是亞馬遜Amazon Go商店的“Just Walk Out”技術。該系統在運作中表現出了清晰的層級結構:

頂層:整體商店管理和庫存跟蹤

中級:客戶跟蹤和行爲分析

低級:產品識別和交互檢測

最低級別:傳感器數據處理和融合

依靠這些AI代理的協同工作,Amazon Go以“不用排隊,拿了就走”的全新購物體驗,在零售行業和科技圈吸引了無數目光。

上述案例只是冰山一角,AI代理在實際應用中的想象力正在被激發。

小模型與Copilot覆蓋超100家公司12萬用戶

在了解了小模型與AI代理的概況後,讓我們一起探索微軟與工業企業的最新合作。

本次嘗試微軟小模型的企業包括拜耳、羅克韋爾自動化、西門子、Sight Machine等。

以羅克韋爾自動化爲例,該公司從操作層面开始嘗試應用小模型。在人機界面可視化平台FactoryTalk Optix的食品和飲料版本中,他們運用小模型,將行業特定功能的優勢帶給制造業一线工人,支持食品和飲料領域的資產故障排除。AI模型爲工廠車間工人和工程師提供關於特定制造流程、機器和輸入的實時建議、解釋和知識。

另一款產品FactoryTalk Design Studio是羅克韋爾自動化專注於系統設計的雲原生軟件,它使用Copilot增強了PLC代碼創建和用戶管理。工程師能夠使用自然語言提示執行產品指導、代碼生成、故障排除和代碼解釋等任務,使系統設計更快、更直觀。

同樣,西門子正在爲CAD解決方案NX X軟件引入全新的Copilot。該軟件利用經過調整的AI模型,使用戶能夠通過自然語言提問、獲取詳細的技術見解並簡化復雜的設計任務,實現更快、更智能的產品开發。

目前,包括舍弗勒和蒂森克虜伯自動化工程在內的100多家公司正在使用西門子工業Copilot來簡化流程、解決勞動力短缺問題並推動創新。12萬名西門子工程軟件用戶,現在有機會通過生成式AI驅動的助手來提升工作效率。

作爲敢於喫螃蟹的用戶,蒂森克虜伯自動化工程公司是首家使用Copilot的公司,並且計劃從2025年初开始,在該公司的全球體系內普及應用。

根據實踐,工程師現在可以在30秒內創建可視化面板,並生成代碼,根據經驗這些代碼僅需20%左右的調整就可以直接應用。這簡化了工作流程,減少了人工工作量,解決了熟練勞動力短缺的問題。

就具體場景而言,蒂森克虜伯使用AI輔助开發用於生產汽車電池的自動化系統。例如在一台電池質量的檢測裝置中,傳感器、攝像頭和測量系統集成在一起,監控多個階段的電池單元質量,進行復雜的評估以檢測超出設定閾值的放電。Copilot通過自動執行多個任務,如數據管理、傳感器配置、電池質量檢測等各個重復性步驟,輔助操作員增強了該設備的運行效果。

Copilot:工業生成式AI的現實角色

在工業領域,“想到”和“做到”完全是兩碼事,生成式AI的工業價值尚需被驗證。

古人雲“欲得其利、先知其弊”,要充分發揮小模型的優勢,就必須了解它的局限性。

生成式AI的弊端在於可靠性較低,具有不可解釋性,只能應用於對可靠性要求不高的場合。

小模型的缺點則是精度有限,無法捕捉大規模和復雜數據集中的細致特徵和關系,預測能力相對較弱;此外,它們難以應對復雜問題。這些弊端決定了小模型只能承擔輔助思考的角色,爲我們提供更多可行性方案作爲選擇,而最終決策仍需由人來做。

在實際應用過程中,也是挑战重重。

工業領域廣泛使用AI的最大障礙是數據的缺失。由於工業涉及設備、工藝、操作、環境等多重因素影響,獲取大量且多維的全面數據難度很大。大多數制造商雖然坐擁數據,但其中大部分是時間序列數據,沒有得到適當的標准化,甚至無法用於AI的模型訓練。

數據問題的本質,很多時候不單純是技術問題,而是人員和流程問題。不成熟的數據管理流程、始終存在的OT與IT鴻溝,以及缺乏對小模型的理解,都是導致生成式AI目前僅限於一次性試點或實驗的因素。

因此,目前生成式AI在工業領域更多以虛擬助手的功能存在,並將會持續較長時間。

這些AI虛擬助手爲工廠車間操作員提供指導,或幫助控制工程師編寫PLC代碼。鑑於當前吸引和留住工廠車間人才的挑战,Copilot能夠輕松幫助合成實時信息或提供編碼輔助。

過去,工程師需要熟悉雲平台、傳感器、物聯網、人工智能和不同類型的時間序列和工程數據,而生成式AI則允許工程師輕松進行數據查詢、可視化和工作流程,而無需擔心復雜性。操作員可以按需提出問題,而不需要了解軟件。

許多制造企業配備了復雜的系統和更多的自動化設備,但那些擁有幾十年經驗與知識的資深員工卻逐漸離开了職場,制造商們很難找到年輕的技術人員來維護現有的系統。Copilot可以成爲幫助縮小這一差距的工具。

例如,工業軟件企業Aveva的AI助手可以幫助操作員回答以下問題:上個月車間的最大產量是多少?或者爲什么這台壓縮機本周效率較低?杜邦公司也已經开始使用生成式AI來幫助工程師更快地找到信息,生成式AI可以節省數小時的手冊搜索時間。

這些Copilot就像操作員的專家顧問,根據需要建議如何提高產量、降低能耗等。從某種意義上說,它們與原有的“專家系統”並沒有本質區別,是否採納這些建議取決於操作員。

面臨的挑战也與過去的“專家系統”大同小異:如何建立對顧問的信任。工廠中的新配方經常出現,如果沒有適當的更新和維護,專家系統也會很快過時。另一個風險在於,如何檢查和驗證所有生成式AI的輸出。AI不會說“我不知道”;如果沒有數據,它可能會進行編造。

寫在最後

在這個萬物互聯、智能無處不在的時代,小模型和生成式AI正在工業領域掀起一場革命。從制造車間到產品設計,從運營優化到故障診斷,AI正在重塑着每一個環節。

然而,我們也必須清醒地認識到,工業領域的AI應用之路並非坦途。數據缺失、可靠性不足、解釋性有限等挑战,都在提醒我們要謹慎對待這項新興技術。盡管如此,我們仍然有理由對未來保持樂觀。

隨着技術的不斷進步和企業實踐的深入,人機協作將更加緊密,小模型和生成式AI也將在工業領域釋放出更大的潛力。

參考資料:

《忍不住談談工業大模型》,作者:郭朝暉,來源:蟈蟈創新隨筆

《Microsoft Introduces New Adapted AI Small Language Models for Industry》,作者:Colin Masson,來源:ARC Advisory Group

《What is Agentic AI? Is It the Next Big Thing?》,作者:Nora He,來源:arcee.ai

       原文標題 : 大模型在先,小模型在後,生成式AI試水工業,如何破局數據短缺/可靠性不足?



標題:大模型在先,小模型在後,生成式AI試水工業,如何破局數據短缺/可靠性不足?

地址:https://www.utechfun.com/post/453267.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡