單Agent不就是生物學中的細胞嗎?多Agent不就是一個物種部落嗎?
大家好。我是甘潤澤,畢業於碩士新加坡國立大學(NUS),深度學習方向,現在是AI Agent开發者、全棧工程師。
很高興在AI新智能的俱樂部內給大家做這次分享。我這次分享的主題是《爲什么OpenAI下一步是Agent? 關於Agent你需要知道的一切》
01 什么是Agent?
什么是AI Agent?想象一下你設計了一個電子遊戲,比如馬裏奧賽車。馬裏奧就像一個 AI Agent,他需要在整個遊戲過程中不斷地做出決策,比如何時加速,何時轉彎,何時跳躍,以此來躲避障礙,超越其他車手,最終獲得勝利。
在這個例子中,整個遊戲環境以及其他車手的動作等,都組成了這個Agent的環境。Agent會根據這些信息,做出最佳的決策。比如,如果前方的道路正在向左轉,那么 Agent 就會決定向左轉彎。
AI Agent的本質是一個可以感知其環境、在給定目標下做出決策並採取行動的系統。這些決策是基於它對環境的理解,比如它的目的地在哪,它的位置在哪,周圍有哪些障礙等。
另外,AI Agent還有一個重要的特性,那就是它可以“學習”。也就是說,它可以通過與環境交互,不斷改進自己的決策過程。比如,在多次遊戲後,它可能會學會如何更好地避开障礙,或者找到更好的賽道线路。
總的來說,AI Agent就是那些能夠感知、理解環境,然後做出決策,採取行動,並不斷學習和進化的AI系統。
02 爲什么Agent是接下來AI賽道的主要發展方向?
下一階段大語言模型的發展,目前來看是兩條發展方向,一條是“向下發展”更新整個底層系統;另一條是“向上發展”,也即從更高維度,更智能化,更自動化,增加復雜性的方向,即Agent方向來提升大語言模型的生產力。一個標准的單個Agent模塊包括記憶,規劃,執行,反思模塊,比大語言模型的交互方式更加具備智能性。
此外,人們在不斷添加非常有吸引力的功能,不斷地擴充想象力的邊界,一些很酷的想法包括聯網搜索引擎,運行編譯器功能,這些功能在最近幾個月的研究中被一個個實現。
雖然單個Agent功能強大,上手簡單,OpenAI GPTs本質上就是關於單個Agent的未來人工智能商業模式,开發者在GPTs上开發各式各樣的Agent,用戶买下心儀的GPTs,隨後OpenAI和开發者共享收益。這是一種集合社群,开發者,平台,用戶的充滿想象力的商業模式。
但是這還遠遠不夠,對於未來,我們的想象力還可以往更遠的地方發散。
就比如,GPTs裏面的Agent能不能自我學習,自我進化?
03 向上:黑盒愈黑?
近期OpenAI的Q*項目曝光,本質上是創造一種能夠自己生產新數據,自我學習進化的Agent,這意味者人類將更加難以掌控,我稱之爲“黑盒愈黑”。
神經網絡本身就處於黑盒狀態,一個能離开人類監督實現自我進化的黑盒,其不確定性會大大增加,這個“黑盒”也會更加“黑”。
從好的一面看,一個會自我學習的Agent,恰恰是通往AGI最有希望的一條路。
人們探索AGI已經有近百年的歷史,而希望的曙光從來沒有像今天這樣離我們這樣近,與之伴生的是巨大的不確定性:一個人們越來越難以理解但是越來越強大的黑盒。
04 Agent的兩個小場景
接下來,我將介紹幾個最有代表性的Agent項目,來幫助我們更好的理解Agent。
第一個是爆火的AutoGPT。
AutoGPT因爲在大語言模型基礎上的全自動流程和聯網功能而聲名大噪。在AutoGPT中,你只需要給它設定一個大目標:比如,爲我制作一份創業計劃。它就可以通過大語言模型給出解決方案,並借助聯網功能給出一份報告。
實際上,它給予了人類充分的想象空間。一個月前,AutoGPT的團隊獲得了1200萬美元的融資,實際上是非常振奮人心的:我們正在追求的,不就是服務於人類的高級自動化系統嗎?
斯坦福小鎮是另一個火爆全球的項目。斯坦福小鎮的創作者們在沙盒世界中放置了25個Agent,它們有自己的初始設定,Agent之間用自然語言對話,隨後开始了爲期兩周的實驗。注意這裏的周是指遊戲中的時間:創建者爲這個世界設置了時間規則,Agent在裏面的活動將花費時間。
人們之所以爲這個項目感到驚訝,是因爲大語言模型+沙盒世界的無盡想象力,也是因爲Agent的交互出現了人類意料之外的現象:Agent們自己創辦了派對,並且它們的人際關系變得更加復雜了。
斯坦福小鎮是一個成功的多Agent系統在沙盒世界中的模型,其具有巨大的想象力空間:遊戲世界,真實世界和實驗中的沙盒世界區別又有多大呢?
第三個爆火的項目是CHATDEV。這是一家專門开發AI聊天機器人的公司,團隊裏有各種各樣的AI Agent角色,比如像首席執行官、程序員大牛、測試工程師和設計達人。
人類用戶只需要告訴他們想要做什么——比如說,“我想要定制一個五子棋遊戲”,然後他們的AI Agent們就會开始圍繞這個任務進行討論,彼此交流,最後會生成一份完整的軟件解決方案,包括源代碼、環境依賴和用戶手冊等等。
我們知道軟件开發是一個充滿復雜決策的過程,需要很多細節的考慮和咨詢。但現在,深度學習的新技術已經开始在軟件开發的各個階段進行改進,從根本上改變了我們开發軟件的方式。
在CHATDEV這個公司中,他們採用了所謂的瀑布模型,也就是將軟件开發的過程分爲四個階段:設計階段、編碼階段、測試階段和文檔編寫階段。在每個階段中,都有專門的AI Agent團隊來參與和協作,像是虛擬的程序員、代碼審查員和測試工程師,他們會互相交流、合作,形成一個連貫的工作流。
在這個聊天鏈中,聊天機器人會將每個階段的任務劃分成一些小任務,然後各自去完成。
這個過程兩個好處:一是可以有效地解決問題,因爲機器人們會在聊天中提出並驗證解決方案;二是任務分解有助於節省時間和成本。
比如說,通過CHATDEV,他們能夠在七分鐘內完成整個軟件开發過程,花費只有不到一美元。這要是讓人做,可能需要幾天,甚至幾周才能完成。這就是AI的力量,也是CHATDEV爲我們展示的軟件开發的未來。
上面三個項目向我們展示了三個極具想象力的維度:AutoGPT展示了自動化與大語言模型的魅力(也是Agent的开始),在AutoGPT中,你只需要不停的輸入yes給予它權限即可,或者給予糾正。
斯坦福小鎮展示了多Agent沙盒世界的可能性,其核心本質也顯現:多體的交互將在復雜性上進一步增長(一定程度上復雜性就是智能)。CHATDEV則是最爲明顯的多Agent幫助人類提高生產力,同時Agent編程也开啓了潘多拉魔盒:它們自我進化的开始。
05 Agent未來會如何發展?
我認爲Agent的最終結局將離不开下面問題的答案。
計算機科學創造出的AI Agent,在某種程度上高度向生物學和社會學看齊:舉個不恰當的比方,單Agent不就是生物學中的細胞嗎?多Agent不就是一個物種部落嗎?
下面我列出來十四個Agent的問題,它描述了從多Agent走向AGI過程中必須回答的問題,我認爲,其中每個問題背後都是巨大的想象空間:
功能 Function:Agent如何工作?
實體 Embodiment:它們是用什么做的?
互動 Interaction: 它們之間如何交流?
起源 Origin: 最初的Agent從何而來?
繼承 Heredity: 我們生來就擁有同樣的Agent嗎?
學習 Learning: 我們如何產生新的Agent以及如何改變舊的Agent?
特徵 Character: 哪些類型的Agent最重要?
權威 Authority: 當Agent之間出現分歧怎么辦?
意圖 Intention: Agent如何產生需求和欲望?
能力 Competence: Agent組合在一起能做哪些它們分开不能做的事?
自我 Selfness: 是什么讓Agent團結在一起或者產生人格?
意義 Meaning: Agent怎樣理解世界?
感知 Sensibility: Agent如何產生感覺和情緒?
意識 Awareness: Agent如何產生對其他事物或自我的意識?
舉其中的“權威”來說,目前人們的項目還沒有進入到這一步:如果多個Agent之間起衝突了,誰該服從誰?如果人類和Agent起衝突了呢?
如果一些人和一些人起衝突了,Agent會站在哪一邊?是“力量”的一邊還是“正義”的一邊?人類如果不能處理好這些問題,我們就應該如達摩克裏斯之劍一樣保持警惕和恐懼。
06 Agent與商業:重塑人類文明根基
我認爲用Agent的商業化,它的本質不僅僅是人類某個個體的獲利,而是人類文明的根基重塑。
一位美國教授認爲,新的圖靈檢測方式將是:能否讓一個自主的人工智能系統在人類世界中從10萬美元賺到100萬美元?而OpenAI 將AGI定義爲在大多數有經濟價值的任務中超越人類的自主系統。
當多Agent系統正勢不可當的狂奔在AGI的道路上時,不妨想象一個簡單的場景:我們與超級Agent達成合作,共享創造的經濟價值,這將是多么吸引人。
另外一個基於現實的猜想是,經濟價值上表現能夠超越人類的Agent很有可能會經歷從工作收入到資本收入的過程:前期通過創造產品,內容,服務從人類世界獲取經濟價值,後期發展到通過資本方式從人類世界獲取經濟價值。
這又將引起另外一個嚴肅的問題:最終我們將給予AGI在人類社會中怎樣的政治和社會地位?
我們將如何看待AI 社會?是看作滿足自己欲望的工具,還是平等的物種,還是人類的供養者?以及另外一個嚴肅的問題:哪些地區能夠給予AI更高的社會和政治地位?哪些人或者地區能與AI的合作更加深入?
原文標題 : 【分享】爲什么OpenAI下一步是Agent? 關於Agent你需要知道的一切
標題:【分享】爲什么OpenAI下一步是Agent? 關於Agent你需要知道的一切
地址:https://www.utechfun.com/post/298331.html