百度打的好算盤:讓應用依附百度大模型
有點數·數字經濟工作室原創
作 者 | 有 叔
微信ID | yds_sh
中國互聯網曾經歷過C2C(Copy to China)的階段,即借鑑海外創新,把美國的某種模式搬到中國來。但進入移動互聯網時代之後,中國勢力彎道超車,海外反而會借鑑中國的成功經驗,成了2CC(to China Copy)。
生成式人工智能應用橫空出世之後,AI大模型的發展之路中外也有所差異:國外大模型過分注重“聰明程度”,卻忽略了用戶的使用成本以及應用體驗,導致新增用戶的趨勢在收縮;相比於美國注重算力基礎設施的供給,中國市場更加貼近用戶和市場,推出了多款與行業結合的AI應用。面對人工智能的下一個战場,中外巨頭都在摩拳擦掌。
“不要卷模型,要卷應用”
“過去24個月,AI行業最大的變化是大模型基本消除了幻覺,回答問題的准確性大幅提升。讓AI變得真正可用、可信賴。” 在近期舉辦的百度世界2024大會上,百度創始人李彥宏以“應用來了”爲主題進行了演講,在他看來,AI應用的大規模落地正在成爲現實。
10年,在AI上砸了千億,作爲國內最早深耕AI的企業,百度的一舉一動,都是國內AI大模型的風向標。2023年,ChatGPT火爆,AI狂飆。當國內還在聚焦百模大战時,李彥宏就提出了“不要卷模型,要卷應用”。他認爲,大模型不應該只向內卷算力、卷參數,更應該向外卷場景、卷問題,才能充分釋放大模型潛力和價值。
李彥宏認爲,中國AI的發展道路,是由應用來驅動的,而智能體,則是他最看好的AI原生應用發展方向。
所謂“智能體”,是能夠自主感知環境、做出規劃、執行任務的智能實體。如果用一個比較直觀的公式來表示,智能體=大模型+規劃+反饋+工具使用。和傳統的單體大語言模型這個“黑箱模型”相比,智能體的優勢在於能更容易理解和分析不同組件如何對系統的整體行爲做出貢獻。
英雄所見略同,2023年11月,比爾·蓋茨在其個人網站上撰文表示:“智能體不僅會改變我們與計算機的互動方式,還將顛覆軟件行業,帶來自圖形用戶界面誕生以來最大的計算革命。”他稱智能體將會像過去的Android、iOS和Windows一樣,成爲下一個平台。
扎克伯格也預測,未來智能體的數量可能會達到數十億,甚至超過全球人口總數。今年 3 月,斯坦福大學教授吳恩達指出,他們在研究中基於 GPT-3.5 構建的智能體工作流在應用中表現可以比 GPT-4 要好,基於GPT-4 構建的智能體工作流效果當然還可以更好。他認爲,AI 智能體將在2024 年推動 AI 的大規模進步,甚至可能超過下一代基礎模型所帶來的影響。
11歲的小學生,也能參與創造智能體
黃仁勳在2024年世界政府峰會上被問及人們應該學習什么時,他回答,“因爲我們的工作是創造計算技術,使得沒有人需要傳統意義上的‘編程’,讓世界上的每個人都成爲程序員。”
智能體最明顯的特點便是使用門檻足夠低,誰都能上手。比如在百度的文心智能體平台上,有11歲的小學生創造的智能體,通過搜索和其他渠道分發出去。在大模型幻覺消失之後,越來越多的人靠自然語言提示詞就可以做出很有用的智能體。
盡管智能體降低了用戶的操作門檻,但它的天花板又足夠高,可以做出功能非常強大的應用。多個智能體的協作,還可以解決更加復雜的問題。
比如,公司類智能體對企業傳統官網能實現迭代升級。以比亞迪的智能體爲例,不僅涵蓋了公司介紹、產品圖片和參數展示、线下門店位置等官網基本功能,還注入了主動推薦、及時響應、一對一服務等AI能力。比亞迪的官方智能體上线後,銷售轉化率提升119%。
舉個例子,智能體可以准確理解並推薦“性能均衡”的車型,並展示產品圖片:
在個人的工作生活中,或多或少都會遇到各類法律相關的問題,但不是每個人都能第一時間找到專業的律師來幫自己支招。這時,法律行業智能體“法行寶”就能派上用場。
假設在發生了交通事故糾紛,法行寶給出了四個步驟的指導,先是保留相關證據,請求交管部門去調解,如果調解失敗,可以再提起民事訴訟、申請法院的強制執行。如果需要計算事故損失和賠償金額,可以輸入詳細信息,法行寶的“賠償計算器”就能幫你計算。不僅如此,法行寶可以幫你寫一封起訴狀:
工具類智能體“自由畫布”則能讓用戶可以在一塊類似“畫布”的界面上自由拖拽文檔、音視頻等富媒體素材,迅速生成多模態內容。李彥宏稱其爲是“立即可用的現貨”。它打通了公域與私域資料的限制,比如行業分析師可以使用它來撰寫研究報告,文檔、視頻、音頻等不限格式的文件都可以一鍵摘錄到自由畫布。
AI助理或將成爲移動互聯新入口
法律助手、創作助手,以智能體作爲切口,國內互聯網廠商找到的這個AI應用方向,在大洋彼岸也得到了呼應,美國的頭部廠商最近也正爭先推出AI助理產品。
AI助理(AI Agent)是一種能夠感知環境、進行決策和執行動作的智能實體,具備通過獨立思考、調用工具去逐步完成給定目標的能力,既能爲C端提供個性化應用,也能爲B端提供降本增效方案。對於普通用戶而言,AI助理最核心的功能是AI自主操作手機,輔助完成復雜推理任務。
OpenAI正准備推出一款代號爲“Operator”的全新AI助理產品,可以自動執行各種復雜操作,包括編寫代碼、預訂旅行、自動電商購物等。根據內部員工爆料,OpenAI領導層預計將在2025年1月發布該產品,首先作爲研究預覽版和开發工具推出,屆時將爲开發人員开放API接口。
OpenAI首席執行官阿爾特曼表示,“我們將擁有越來越好的模型,但我認爲下一個重大突破將是AI助手。”站在OpenAI的角度,其在商業化進程中面臨着越來越大的壓力, ChatGPT漸進式的改進可能無法吸引用戶支付更高的價格。高管急切需要一款突破性產品,以證明對AI开發的巨額投資是值得的。
與此同時,微軟近期低調开源了AI工具OmniParser,其可幫助用戶創建個性化智能體,以操作個人計算機;10月22日,微軟宣布在Dynamics 365中集成10個自主AI Agent,支持OpenAI最新模型o1,具備自主學習能力,可自動執行跨平台復雜業務。
谷歌計劃在12月預覽其大型動作模型“Project Jarvis”,該項目將幫助用戶執行諸如“收集研究、購买產品或預訂航班”等任務。
蘋果選擇將Siri與ChatGPT集成,實現更智能的人機交互,另有網友發現蘋果已經默默發布了Ferret-UI的兩個實現版本(分別基於Gemma 2B和Llama 8B),這是蘋果今年5月發布的一個可讓AI理解手機屏幕的技術。
在硬件廠商言必稱AI的時代,AI助理或成爲終端智能化的突破口。更具有想象空間的是,中外巨頭都在押注的AI助理或將掌握移動互聯新入口。因具備較強交互性以及便利性,AI助理有望打通原先同個終端不同App之間的天然壁壘,那樣的話,流量分發格局也必將重塑。
無論是百度、KIMI還是通義、豆包更或是ChatGPT、蘋果、谷歌、微軟,最終誰將掌握新的移動互聯網入口,拿到未來船票,就看誰的應用更智慧、更好用。
未來搶奪AI移動平台超級入口的战爭剛剛开始,先發優勢與後發優勢誰才有真的優勢,就看誰率先打造出AI超級應用平台,這個平台不是單一應用功能,而是無所不能的超級綜合體。
未來,拭目以待。
原文標題 : 百度开完這場發布會,OpenAI、微軟、蘋果都在隔空應战
標題:百度开完這場發布會,OpenAI、微軟、蘋果都在隔空應战
地址:https://www.utechfun.com/post/448308.html