2024 年滿城盡帶 AI Agent。上個月還說在做 AI Copilot 的人,這個月就改做 Agent 了,現在流行 AI 駭客馬拉松,一場至少能看見幾十個「AI Agent」。
大語言模型爆發這年,我們在「概念陷阱」裡鬼打牆,大談各種新名詞:Agent、Copilot、RAG、Reasoning、Grounded、Alignment……說實話有點膩了,嘴邊不常掛著這些詞,就不能做AI了?
如「AI Agent」,做了自動寫IG發文的GPTs,說這是寫作Agent;做基於大語言模型的RPG角色模擬器,說是遊戲開發Agent……這時有人說:都是AI輔助工具,充其量只是Copilot(副駕駛),你看史丹佛大學和Google搞的「史丹佛小鎮」,25個AI互相溝通和協作,那才是真正的AI Agent。究竟誰說的對?什麼才是AI Agent?這其實是現狀:當下討論AI概念,人們卻以缺乏共識的定義為前提,所以認知從沒「對齊」(align)過。
很多人拿「AI Agent」當成大語言模型時代的新名詞討論,殊不知Agent是個骨灰級AI概念。Agent第一次成為AI術語,是1995年出版的經典AI教科書《人工智慧:現代方法》(Artificial Intelligence: A Modern Approach),定義AI是:「智慧代理的研究和設計」(study and design of intelligent agents),看來將Agent當成AI發展的終極目標,至少也是快30年前的事了,折射出人類發展AI的初衷,即尋找人類所有行為的「代理人」。
不少人還忽略Agent其實也是經濟學和組織行為學概念,現代經濟社會充斥各種Agent,如公關代理公司(PR Agency)、旅行社(Travel Agency)等,都具機構代表某方行動和交易的意思。AI定義的Agent,意義與經濟學和組織行為學很接近,即AI為一人或組織代表,進行某種特定行為和交易,降低一人或組織的工作複雜程度,減少工作量和溝通成本。
AI真正成為Agent就是靠大語言模型。AI Agent這古老概念2023年翻紅並不是巧合,OpenAI 安全團隊負責人Lilian Weng知名文章〈LLM Powered Autonomous Agents〉,普遍視做OpenAI對AI Agent的官方定義,文章將Agent定義為大語言模型(LLM)、記憶(Memory)、任務規劃(Planning Skills)和工具使用(Tool Use)集合,LLM是大腦,記憶、任務規劃和工具使用是Agent三個核心元件。值得注意的是,文章強調Agent自動調取外部API工具,自動子目標分解任務,自動建立思維鏈(CoT)、自我批評和自我回饋能力,都指向文章標題的關鍵詞「autonomous」,即Agent自動化。
AI革命普遍視作「第四次工業革命」,前三次是19世紀初蒸汽革命、19世紀末的電力革命、20世紀中葉的資訊技術革命。貫穿前三次人類工業革命的關鍵詞當屬「自動化」(automation)。蒸汽機和電力革命實現工業生產體力勞動的自動化,提高生產效率。資訊技術革命提高工業生產自動化程度同時,也可取代人類部分腦力勞動。第四次工業革命的AI革命,一方面將工業生產自動化執行更徹底(如機器人和滿是感測器的無人工廠),另一方面前所未有開啟腦力勞動自動化。腦力勞動自動化的載體,就是AI Agent。
從這個意義,什麼是AI Agent爭論有點無聊。史丹佛小鎮是基於論文的先鋒實驗,當作評判AI應用是否Agent的座標,無助AI Agent提高智力密集型效率。筆者暴論:AI Agent本質就是automation of human action(人類行為自動化),只要它不是人類要求的完成任務,就像ChatGPT對話框輸入prompt、啟動Office 365的Copilot完成工作,而具備一定程度完成任務的自主性甚至不完全可控,就是AI Agent。
現在較尷尬的是:你可能讀過不少AI Agent論文和社群討論,卻沒真的用過順手的Agent,這恐怕是Agent這新物種注定要經過的階段。人們常提到AI Agent典範是接入GPT能力的AutoGPT,不過無論美國或中國,已有更好用AI Agent的雛形。
第一個是ChatGPT新升級付費版ChatGPT Team,提供小型企業用個人ChatGPT帳號協作的「私域空間」,ChatGPT Team用戶數據不會用來反向訓練GPT模型,使用者還可創建企業GPTs,讓這些GPTs合作。筆者覺得ChatGPT Team比GPT Store更重要也更實用,GPT Store太亂,多數GPTs品質粗糙,對話框指令幫忙做什麼,且不能用API。但私密環境ChatGPT Team,GPTs互相調用介面、合作順利多了。ChatGPT Team是ChatGPT走向AI Agent的第一步,畢竟ChatGPT已有15萬企業客戶。
第二個是中國智譜AI的GLM模型智慧體(GLMs),是中國清華大學體系出身最像OpenAI的公司,剛推出的GLM-4一切向GPT-4看齊,許多評測基準達GPT-4 85%以上。GLMs是GLM-4的副產品,也是GLM-4模型能力的外溢。GLM-4的All Tools支援GLM-4依使用者需求決定是用繪圖、搜尋、製表還是程式設計解決問題,本身就具AI Agent屬性。與Open AI只追求通用性不同,智譜AI對金融、醫療和教育等都有系列客製服務,積累不少to B客戶基礎和業界know-how,讓客戶基於GLM-4部署GLMs智慧體更合理也更容易。
第三個也為中國清華大學背景的「面壁智慧」:有自己的「史丹佛小鎮」,基於面壁智慧的ChatDev框架,但此小鎮不是虛擬社會,而是AI版軟體公司,不同AI智慧體設為工程師、產品經理、測試工程師和設計師等角色,可互相合作,還能站在自己立場互相博弈,就與人類上班會發生的事一樣。面壁智慧ChatDev框架支援開發者搭建自己的AI Agent,結合單體和群體智慧,讓AI Agent成為每個員工都能用的「逃避」很多狗屎工作的自動化工具。順提ChatDev框架成形並不比史丹佛小鎮論文發表晚,最大啟示是原生AI應用開發可能性:AI Agent實現AI應用開發自動化。
第四、五為中國釘釘和飛書「智慧體」。AI Agent本質更接近產品而非技術,如果認為AI Agent是生產力工具,就不能忽略釘釘和飛書的上億使用者,百萬政企組織,大量文件、會議摘要、溝通記錄、表格和自建工具,都讓釘釘「智慧助理」和飛書「智能夥伴」更容易化身成每個使用者的助理,部分自動完成例行瑣事,如工作總結、會議摘要、報帳和出差流程、追蹤回饋,甚至代理吵架。身為使用者,筆者得說釘釘智慧助理和飛書智能夥伴離好用還差得很遠,恐怕是通義大模型和雲雀大模型的鍋,但場景豐富、數據真實、用戶數量大,釘釘「智慧助理」和飛書「智能夥伴」更容易被用。Agent也是在使用過程有更佳理解能力,模型進步後,釘釘和飛書Agent化就會往前大步走。筆者再下暴論:釘釘和飛書會成為中國AI Agent的重要產品。
好用和好玩選一,筆者堅信對AI Agent好用比好玩重要,因首先是生產力工具,AI紙片男女友也有理解能力和情緒價值,但可叫成「智慧體」或「智慧玩偶」,卻不是「智慧代理」,因不具代理人類完成某項任務或使命的功能。所以AI Agent翻成「智慧體」不適合,它就是「智慧代理」,「代理」屬性是AI Agent的經濟學和組織行為學,也是推動腦力勞動自動化的本質。
今年CES史丹佛大學知名AI學者李飛飛提出一個重要觀點:應該確定AI Agent取代的是人類「任務」而不是「工作」。達沃斯論壇時,OpenAI CEO Sam Altman面對「AI讓人失業」這老生常談詰問時,只說:AI取代人們工作的方式,而不是工作本身。
筆者同意李飛飛和Sam Altman的觀點,腦力勞動者的工作是由每個具體關鍵任務組成,但不是工作的全部,目標設定、創造性、資源取得和分配、設定更高目標、規劃不同任務、判斷力、說服力與表現力……我們工作有太多更有意義的元素,將流程、事務性和庶務性任務交給Agent,少寫幾行常規代碼,少發幾封吵架信,少做機器操作表格,少調幾次PPT格式,少複製黏上,少親自填寫和審查出差和報帳流程,人類工作應該更愉快,也更有創意。
當然AI Agent普及,也許會讓某些「白領工人」無所適從甚至失去工作,但也會提高很多職位,甚至基層聰明人的創造性、格局感、整體感和生產力,提高工作效率,創造更高生產力同時,更重要的是減少工時。
八小時工作制成為通用標準已是百年前的事了,人們之所以每天工作八小時,是工人抗爭的結果,也是電力工業革命後生產力大爆發的產物。在更高生產效率面前,人們有底氣爭取更少工時、更高工資和更多學習、休閒、旅遊消費時間。但計算機革命後,人類生產效率又前所未有地提高,為什麼工時卻沒有減少,反而某些號稱最高智力密集的科技和網路公司甚至更長?這裡面一定出了問題。
筆者再來暴論:將來衡量AI Agent智慧化程度如何,可看是否讓人類每天只需工作四小時,重複性、流程性、條件反射式性、經驗主義可奏效、強化學習可理解,甚至表演性質工作,統統交給AI Agent:可能是釘釘和飛書,可能是面壁智慧的工作坊,也可能是GLM和GPT企業版,反正筆者只要結果,因真的只想每天工作四小時。
不久前和釘釘總裁葉軍聊天,筆者問這玩意能讓我們每天只上班四小時嗎?他說:如果可能每天只需工作一小時。事後筆者覺得葉軍誇張了,不過他還說AI Agent能讓更多人當自己老闆,筆者倒是同意這點。
(本文由 授權轉載;首圖來源:shutterstock)
標題:AI Agent 的任務,是讓人類一天只需工作四小時
地址:https://www.utechfun.com/post/336068.html