OpenAI推出的GPTs是不是Agent?爲何能讓很多AI智能體項目半年白幹?
很多人說GPTs不是真正意義上的AI Agent,爲何卻被稱作Agent殺手?
OpenAI宮鬥100+小時期間數量超兩萬的GPTs,真會成爲AI Agent殺手嗎?
GPTs到底是什么?與AI Agent有什么區別?爲什么說它會殺死AI Agent?
爲何“准Agent”GPTs對真AI Agent造成那么大衝擊?真的會殺死AI智能體嗎?
說GPTs會殺死AI Agent有些危言聳聽,Agent未來生態注定百花齊放
文/王吉偉
OpenAI的宮鬥大戲已經告一段落,精彩劇情的余韻仍在久久回蕩。
波瀾起伏的劇情,精湛的演技,硅谷大佬的客串,100多個小時的演繹,締造了這部足以載入史冊的AGI成長大戲。劇中角色則被賦予更多傳奇色彩,比如Sam Altman一度被視作當年被董事會罷免的喬布斯,而Ilya Sutskever也被貼上了“AGI衛道者”的標籤。
這場宮鬥的真正根源,到現在還在市裏坊間被人猜測。其中最有可能的一個原因是,GPT已經發展成爲能夠威脅人類的AI,所以衛道者Ilya要出來幹預,不惜使用各種手段阻止OpenAI帶有重大危險因素的超高速成長。
Sam要通過商業手段推動OpenAI疾馳,Ilya則要確保AI在監管之下可控發展。
兩人都是AGI的篤信者,發展理念卻在OpenAI的第一個开發者大會之後產生了強烈衝突。Sam相當激進,Ilya過於謹慎,於是矛盾一觸即發,而導火索可能恰恰就在於GPTs。
從Sam被开除开始,大家都在關注OpenAI宮鬥這幾天,GPTs仍舊以超高的速度發展,目前GPTs的數量已超過2萬。超低的創建門檻和APP Store一樣的商業模型,必會讓OpenAI快速構建GPTs生態。
但另一方面,目前這些GPTs還存在不少問題。就以安全可言,99%的GPTs都在裸奔,幾句話就能套取知識庫文件。如果這些GPTs都在對人類存在潛在威脅的大語言模型之上運行,後果可想而知。
當然,這些仍然還是猜測,也不是本文討論的重點。
事實上,GPTs推出後在創投領域引起更多不滿的,是OpenAI爲何既要做底層技術又要做上層應用。這直接殺死了相當數量的基於GPT的Agent相關項目,當然大量項目都是Sam所說的“簡單模仿、套殼OpenAI”公司的項目。
不管這些項目是不是在套殼OpenAI,GPTs以及Assitant API的推出,確實對第三方Agent構建框架及工具造成了不小的衝擊,就連Langchain、LlamaIndex等都已被看作一無是處了。
有意思的是,一些人並不認爲GPTs算是真正的Agent,因爲現在的大多數GPTs僅是實現特定功能的聊天機器人。這樣的東西,又怎能取代或者殺死結構完整功能強大的獨立Agent呢?
那么,GPTs 到底算不算Agent?GPTs的推出是否真的意味着开發者幾個月來構建的Agent產品和开源項目都會死亡?GPTs是否真的有能力殺死所有AI Agent?
本文,王吉偉頻道就跟大家聊聊這些。
從GPTs說起
OpenAI官方對GPTs的定義是,用戶爲特定目的創建的ChatGPT版本。
任何人都可以創建量身定制的GPTs,用於日常生活、特定任務、工作或家庭中獲得更多便利以及提升效率,也可以制作僅供公司內部使用的GPTs,比如幫教孩子數學或者設計貼紙、學習棋盤遊戲、搜索資源、數據分析等。
此外,用戶還可以分享創建的GPTs,以讓更多人使用它們提升各種場景的使用效率。想要詳細了解GPTs,大家可以到OpenAI官方博客查看《Introducing GPTs》這篇博文。(沒有魔法的朋友不用急,王吉偉頻道准備了中文版,可以在後台發消息 GPTs 獲取。)
要構建一個GPTs也非常簡單,不用代碼,只需與GPT Builder(OpenAI推出的GPTs創建器)進行對話,並爲其提供說明和其他知識,再選擇GPTs能夠執行的搜索網絡、制作圖像、分析數據等操作,一個GPTs就創建完成了。
GPTs可以做很多事情,比如學習棋盤遊戲的規則、幫孩子學習或者設計貼紙。還可以把GPT和外部服務連接起來,讓它們訪問更多的信息和功能。例如,通過連接翻譯API,GPT就可以通過訪問數據庫獲取實時數據進行分析,實現用多種語言交流。
爲了讓用戶感受GPTs的魅力,OpenAI官方推出了16個GPTs,用戶可以直接使用這些GPTs。在構建GPTs時,用戶也可以選擇是否使用DALL-E圖片生成或者代碼解釋器。
這16個GPTs如下:
DALL·E GPT:讓你的想象變成圖像。
Data Analysis:放入任何文件,幫助分析和可視化您的數據。
ChatGPT Classic:最新版本的GPT-4,沒有附加功能。”
Game Time:快速向任何年齡的玩家解釋棋盤遊戲或紙牌遊戲。
The Negotiator:幫助你爲自己辯護並獲得更好的結果,成爲一名出色的談判者。
Creative Writing Coach:渴望閱讀您的作品並爲您提供反饋以提高您的技能。
Cosmic Dream:有遠見的數字奇跡畫家。
Tech Support Advisor:從設置打印機到對設備進行故障排除,逐步爲您提供幫助。
Coloring Book Hero:把任何想法變成異想天开的圖畫書頁。
Laundry Buddy:回答任何關於污漬、設置、分類和一切洗衣的事情。
Sous Chef:根據你喜歡的食物和擁有的食材給你食譜。
Sticker Whiz:把你最瘋狂的夢想變成模切貼紙,直接送到你家門口。
Math Mentor:幫助父母幫助他們的孩子學習數學。
Hot Mods:把你的形象修改成真正狂野的東西。
Mocktail Mixologist:用你手頭的任何食材制作無酒精雞尾酒食譜,讓任何派對都大放異彩。
genz 4 meme:?幫你理解行話和最新的表情包。
OpenAI推出這些不同的GPTs,不僅對外展示了GPT 模型的技術實力,也意味着個性化AI助手將成爲我們日常生活中不可或缺的一部分,在未來滿足我們獨特的需求和興趣。
從現在已經推出的各種GPTs來看,有的比如使用Zapier插件的GPTs已經能夠處理稍微復雜一些的業務流程,但大部分GPTs僅是聊天機器人,還無法實現復雜任務的執行。
所以,GPTs 到底算不算Agent呢?
從Agent定義及架構看GPTs
OpenAI开發者大會以後,比爾?蓋茨(Bill Gates)在其博客發表了一篇名爲《AI is about to completely change how you use computers》的文章,並很快刷屏國內外。(後台回復 GPTs,獲取該文章PDF漢化版。)
在這篇文章中,他提到了Agent與機器人(如Clippy等)的區別,主要有以下三點:
積極主動地根據用戶需求提出解決方案;
能夠跨應用程序完成任務;
隨着時間的推移而改進。
按照這幾點,現在除了部分能夠參與企業業務流程的GPTs(如通過Zapier等插件以API調用CRM、HR等相關企業應用),大部分GPTS都是跟ChatGPT一樣的對話機器人。
這一點也無可厚非,畢竟GPTs要做的就是爲用戶定制各自專屬的ChatGPT,而更多人的需求可能就是通過對話生成一些內容。
但創建GPTs過程中Action的加入,讓部分GPTs具備了執行能力,比一般機器人強大得多,足以連接部分現實世界。
我們還可以把GPTs帶入現在業界公認最理想的由OpenAI提出的“LLM+規劃+記憶+工具”四件套Agent框架。
可以發現,大部分GPTs在工具使用方面還未達到AI Agent的標准,因爲它們僅在“knowledge”中上傳了一個知識文檔,僅是一個通過對話來獲取文檔相關知識的對話機器人,並沒有涉及工具使用這個部分。
這類GPTs只能根據輸入的指令進行思考並給予用戶文字、圖片等內容的反饋,而無法去執行某些目標比如操作一些軟件去完成相關任務。
事實上,用於構建GPTs的GPT Builder正是一個標准的Agent。用戶提交需求指令之後,GPT Builder會通過設定目標和任務分解,通過互動一步引導用戶去完成GPTs的構建,就連logo都可以根據指令自動生成。
GPTs對外展示了Agent的相關功能,並證實了Agent連接真實世界的可行性。這些GPTs能夠連接到其他產品和服務,從電子郵件到購物網站,使AI可以執行更廣泛的任務。
OpenAI通過GPTs讓更多人知道了什么是AI Agent,以至於有人將GPTs稱之爲下一波人工智能浪潮的先驅。
到現在爲止,大多數GPTs缺乏用戶所期望的自主程度,還達不到自主智能體(Autonomous Agent)的級別。其實就連Sam Altman也沒有說GPTs就是真正意義上Agent,他在开發者大會上用了“Precursors”一詞,用以表明GPTs屬於Agent的“初期形態”。
所以在一些探討GPTs與AI Agent的觀點中我們可以發現,GPTs被看作是“幾乎成爲Agent”或者“准AI Agent”。
“幾乎”與“就是”,還是存在一些差距的。
那GPTs與Agent尤其是自主Agent相比,有什么區別呢?
GPTs與AI Agent的區別
在大家所說的GPTs會殺死的Agent項目中,有些項目比如Baby AGI 、MetaGPT及Aiagent等在運行過程中,可以明顯體現合格Agent應該具備的特性。換句話說,它們的表現要比GPTs強很多。
OpenAI开發者大會之後,LangChain曾在X發推文強調了其與GPTs的區別以及自身優勢,並在11月10日推出了一個名爲Opengpts的开源項目。
該項目通過整合LangServe和LangSmith,旨在爲用戶提供與OpenAI GPTs相似體驗的平台。相對於OpenAI只能用GPT模型構建GPTs,在Opengpts用戶可以通過選擇不同的語言模型、自定義工具以及控制提示,實現對聊天機器人更靈活的控制。
從目前GPTs的表現與“獨立”AI Agent所具備的功能來看,兩者存在以下幾點區別:
1、GPTs仍舊處於試用階段。
雖然GPT Shunter(一個第三方GPT Store項目)收集的GPTS數量已經超過2.1萬,但大部分GPTs產品形態仍舊比較初級。
目前GPTs所表現的屬性更易於分享,但在功能上仍舊差強人意,屬於個人娛樂及應用產品的試用階段,並不適合大量企業去使用。
2、技術棧存在一定限制。
GPTs基於大語言模型GPT-4構建並與OpenAI的生態系統緊密關聯,這也意味着开發者所能用的整體技術棧存在一定局限性。
GPT並不开源,所以構建GPTs在LLM的選擇上只能基於GPT,而不能選擇更多的LLM。同時當前版本在使用上也有一些限制,比如最多只能上傳10個數據文件。
3、GPTs構建者技能水平不同。
“獨立”AI Agent的構建者主要是开發人員,GPTs的構建者大多是不會代碼的業務人員。目前大部分GPTs都是用簡單指令提示來構建的,這讓GPTs的數量快速暴漲,這也使得GPTs在專業程度上要差很多,更適合自娛自樂或者解決簡單業務流程。
程序人員還可以用Assistant API構建功能更多更專業的GPTs,這些才有可能成爲企業級Agent應用。
4、能處理的任務和GPTs的能力。
現在AI Agent正在成爲各種類型的智能助理,可以用於訂餐、买機票以及編程等相對復雜的業務流程。GPTs也有很多不同用途像私人教練、老師、咨詢師等,但大多數仍然是聊天機器人。
它更像各種角色扮演類AI,人們可以自定義各種角色來娛樂或者處理簡單事務,比如用來生成各種文本以及用DALL-E生成圖像等。
當然,GPTs已能夠參與部分企業運營的業務流程,比如使用Zapier GPT訪問日歷或者Slack等。但目前它還無法深入到企業運營中的比如SAP、用友、金蝶等的復雜流程中去。
主要在於,一方面很多企業管理軟件缺少API,另一方面有些API授權費用太高,此外API也不是絕對穩定。
5、技術和安全挑战
目前的AI Agent經常被批評不可靠,因此還沒有實現量級的企業級應用。GPTs也面臨着同樣的問題,會出現幻覺、在同一提示下提供不同的結果以及不能真正理解潛在過程,會產生隨機結果。
除了大模型本身問題,目前GPTs更大的問題是數據安全,據說目前99%的GPTs都在裸奔,幾句話就能套走GPTs的數據庫。這些問題,會讓企業在GPTs的選擇上更加謹慎。
理論上,可以通過更高級的模型或圍繞Agent構建產品以彌補可靠性的不足。比如實在智能推出的RPA Agent,就在數據安全上下了很大的功夫,在大語言模型和RPA工具包上都設置的多重安全機制,以保證用戶更安全的使用AI智能體。
6、初級階段的GPTs缺乏產品屬性
到目前爲止,GPTs缺乏具體的產品特性,或者說缺乏一種利用GPTs开展業務的方法。不具備產品級應用的試用性產品,在安全、應用、數據、擴展性及解決方案方面很難達到企業要求,不容易在企業推廣。
此外GPTs僅供ChatGPT付費用戶及企業用戶使用,限制了更多人的使用,且沒有定價策略或產品等級差異化的選項。或許這些,都要等到GPT Store的正式上线。眼下OpenAI宮鬥大戲剛剛落幕,GPT Store何時上线還是個謎。
GPTs會不會殺死AI Agent?
盡管OpenAI推出的GPTs還不算成熟的AI Agent,或者說處於Agent早期階段,但無疑它響應了一種趨勢,即Agent將會無處不在。GPTs這種形態的大語言模型產品會讓人人都能用上Agent,這是它的偉大之處。
接下來隨着GPT Store的推出,GPTs將會成爲現在APPs一樣存在於每個人的手機、平板抑或其他形式(比如最近的風頭正盛的AIpin)的通訊、娛樂及辦公產品之上。
目前的GPTs還很原始,大部分都屬於定制化的面向某個功能的比如心理咨詢、產品說明、文字及圖片生成等聊天機器人。
但從業務流程角度而言,很多企業的一些業務部門比如市場營銷、客戶支持、新媒體、HR、法務等,某些業務的大部分流程都是文字、語音交互和生成,應用GPTs足以完成大部分任務,在安全、合規的情況下這些部門將非常適用GPTs。
如果簡單的GPTs就能勝任企業運營的多種業務場景,是不是就無需再去耗費精力與財力打造所謂的專業單體自主Agent?同時,SaaS化的GPTs开發是不是也比程序員以代碼構建專業Agent更爲便捷與高效?
目前GPTs還無法介入企業運營的復雜流程,但我們也看到了通過Zapier等插件實現了與電子郵件、旅遊網站及支付軟件等的集成,已經能夠操作部分企業經營的業務流程。
關於企業內部應用GPTs,是另一個需要探索的話題,王吉偉頻道在這裏跟大家簡單聊聊。
現在已經有一些企業在內部進行GPTs的構建與分享,以定制面向不同業務場景的ChatGPT。比如Amgen、Bain 和 Square等企業,已經先一步开始應用自己的專屬GPTs。但這些企業GPTs是用在內容生成與理解還是深度的業務運營,目前尚不可知。
通過API調用的各種插件及應用,在OpenAI的Agent架構中都屬於工具應用。這些工具可以是簡單的郵件列表讀取,也可以是復雜的CRM、OA、工作流等流程編排與管理。
OpenAI還沒有更重量級的工具,但其投資的一家RPA公司Induced AI,“RPA 3.0”形態的產品正是基於GPT的智能體。
大膽猜測一下,這個產品在以後很有可能會以插件或其他形式成爲OpenAI Agent架構中諸多工具中的一員,未來或將彌補GPTs在業務流程執行層面無法操作非API工具的不足。
如果Induced AI能夠做這些,其他RPA廠商也能做到。隨着更多RPA廠商推出相應插件,用GPTs操作更多組織運營中復雜流程也就不再是夢。尤其是現在借助Assitant API將原有產品改造升級成爲基於GPT的Agent,前所未有的簡單。
王吉偉頻道認爲,理論上配合API和RPA,GPTs能夠通達到組織運營各處。就看企業如何衡量它的運行功效,以及在安全方面是否能夠經得住考驗。
鑑於以上幾點,GPTs真有可能成爲Agent殺手,至少它已經讓很多基於GPT-4的第三方Agent的道路不好走了。
好在,LLM廠商並非只有OpenAI一家。
AI Agent生態不只有OpenAI
今天我們所說的Agent,都是基於LLM的Agent,它離不开LLM的支撐。
對於AI Agent的未來生態,比爾蓋茨認爲不會是一家公司主導AI智能體業務的局面,而是會出現許多不同的人工智能引擎可用。
更多的競爭將會讓包括GPTs在內的智能體變得非常便宜,有利於更多人使用AI智能體。
現在全球有那么多大語言模型,單是國內就有200多個。既然OpenAI能夠造就GPTs,自然其他LLM廠商也能推出同類產品,或者會與第三方平台合作推出類似產品。
因此GPTs不會只誕生在OpenAI,像谷歌、Meta等科技巨頭必然更希望其客戶基於自有大模型开發類GPTs產品及更完善的Agent產品。
就在OpenAI宮鬥這幾天,亞馬遜、Meta等廠商已經收到更多的AI相關業務咨詢;OpenAI競爭對手Cohere的咨詢量也是大幅增加;Writer的企業客戶對其服務的興趣已經增加了兩倍;Habib則一直在宣傳其AI系統在某些場景下比GPT-3.5模型更好。
這次宮鬥事件確實爲AI技術採买帶來不小的影響,用AI21聯合創始人Yoav Shoham的觀點表達就是,OpenAI發生的事情讓更多企業確信,無論如何都不想把所有雞蛋放在一個籃子裏。
至於國內市場,不只是無法應用GPT等海外大模型,還會因爲信創等衍生出更加多元化的需求,也將會有更具特點的類GPTs產品出現。
此外僅有GPT一個大語言模型,也無法滿足用戶對於GPTs的廣泛需求。未來許多GPTs可能都需要在OpenAI之外开發更多特性和功能,开發人員會圍繞GPTs構建更復雜的產品。
從這一點而言,以後LLM廠商及Agent廠商們可能會傾盡所能適配更多大語言模型,甚至不排除OpenAI也會將第三方LLM加入產品體系的可能,以支持用戶對於多類型與功能GPTs的構建。
事實上,AI Agent想要真正在B端實現量級業務場景的落地及更好地商用,需要綜合考量其本身的安全性、技術發展周期是否成熟以及To B端的場景是否密切貼合,還需要考慮接口成本、隱私、管理、授權等諸多因素。
這既是很多供應商的技術與產品門檻,也是廣大企業選型的重要依據。
企業在選擇用於業務流程自動化的AI智能體時,也會優先考慮技術供應商廠商推出的AI智能體產品,而不是選擇LLM廠商推出的尚未成熟的通過API連接各種插件的單一智能體解決方案。
這些,都是眼下GPTs這種單一智能體所無法具備的。至於GPTs什么時候能夠發展成爲成熟智能體產品,就要看OpenAI如何在企業用戶端下功夫了。
在王吉偉頻道看來,GPTs確實扼殺了一些Agent相關的初創公司,但大多是Sam Altman所說的“套殼與模仿GPT”的項目。對於AI Agent而言,GPTs目前遠未表現出殺手級實力,並且它也殺不死那些爲專有功能而構建的復雜類型Agent。
GPTs的出現反而啓發了更多企業的創新,會讓Agent產品在短期內海量爆發,用最快的速度構建與完善AI Agent生態。
或許,以GPTs範式引領Agent繁榮生態,早日實現AGI,才是OpenAI最想做的。
全文完
【王吉偉頻道,關注AIGC與IoT,專注數字化轉型、業務流程自動化與RPA,歡迎關注與交流。】
原文標題 : GPTs到底是什么?與AI Agent有什么區別?爲什么說它會殺死AI Agent?
標題:GPTs到底是什么?與AI Agent有什么區別?爲什么說它會殺死AI Agent?
地址:https://www.utechfun.com/post/296431.html