文 | 戴菁
大模型重新詮釋了「中國速度」。自從今年3月百度發布國內首個類GPT產品以來,短短3個月時間,國內已經跑出79個10億參數規模以上的大模型。
《中國人工智能大模型地圖研究報告》還提供了另外一個觀察視角:美國和中國發布的通用大模型總數已佔全球發布量的80%。很明顯,中美兩國的科技企業正在成爲這輪席卷全球的生成式AI革命的主要推手。
Open AI和微軟構成的聯合陣營,已經在教育、投行、辦公領域打造出多個標杆級的應用落地場景,如堪稱王炸的Office全家桶、語言學習平台Duolingo的AI陪練、摩根士丹利的數十萬頁知識庫,以及支付服務平台Stripe用於打擊欺詐的最新解決方案。這些落地案例同時涵蓋了B端和C端。相較之下,國內大模型的上线速度之爭剛剛告一段落,大規模商業應用落地還在路上。
這段路極具挑战,但至關重要。百度CEO李彥宏最近在一次會議上強調,「新的國際競爭战略關鍵點不是一個國家有多少個大模型,而是你的大模型上有多少原生的AI應用,這些應用在多大程度上提升了生產效率。」
公开信息顯示,跑在最前面的文心一言,目前已經推出11個行業大模型,覆蓋汽車、能源電力等多個to B領域。
此時誰能打響大模型to C應用第一槍,成爲備受關注的一個焦點。注意,是商業應用上的打「響」,而不是PPT層面的「打出」。
圖源:《中國人工智能大模型地圖研究報告》
站在C端用戶視角,《降噪NoNoise》認爲,教育和搜索兩個領域都有機會:教育無需贅言,從那些AI學習機等終端硬件的熱賣不難看出,要說大模型的剛需付費群體,還得是家長;至於搜索,擁有GPT的新Bing可以讓微軟CEO納德拉驕傲地說出——是微軟讓谷歌「跳舞」,可見大模型爲搜索帶來的想象空間有多大,而且搜索本身就是世界上規模最大的AI應用場景。
同時看到這一前景的百度也在不舍晝夜地「煉丹」。通過密集推出「AI夥伴」等生成式AI產品,百度希望加快將搜索帶入新時代,並繼續保持市場引領者的地位。
問題來了,搜索會打響大模型大規模應用的第一槍嗎?
01
搜索框背後的幾個真相
在回答這個問題之前,我們需要先界定搜索與大模型的關系本質。
ChatGPT橫空出世後,一種聲音認爲谷歌、百度等搜索巨頭都將被顛覆,Open AI 會成爲搜索遊戲規則的改變者。
最負盛名的代表人物是微軟聯合創始人比爾·蓋茨。他在年初預言,未來的頂級AI公司會在AI個人助理上發力,用戶永遠不會再去搜索網站和亞馬遜。盡管在2019年9月之前,蓋茨對Open AI的技術能力一直存疑,還被馬斯克懟過「對AI的理解十分有限」。
置身事內的搜索巨頭們顯然持有不同看法。「我覺得應該會加強百度的地位,因爲ChatGPT要解決的問題很多就是搜索要解決的問題,它們的目標是一致的。」近期在一檔名爲《新智者首席Time》的欄目訪談中,百度副總裁、搜索平台負責人肖陽作出自己的判斷。自2004年加入百度,肖陽見證了搜索行業20年的發展歷程。
從演進路线來看,搜索引擎誕生之初要解決的是信息獲取效率的問題,爲用戶提供從提問到答案的最短路徑。此前類似的檢索任務先後由《大英百科全書》、網絡黃頁等信息工具來承載,直至算法出現。
算法讓搜索引擎天然擁有AI基因,因爲機器執行任務的前提是「理解」搜索框背後的需求。
只不過在不同階段,信息匹配的方式各不相同。
以肖陽入行的2004年爲例,當時搜索引擎還處於關鍵詞檢索時代——用戶要像在圖書館裏搜書一樣,在搜索框敲下關鍵詞,然後通過不斷變化關鍵詞,找到精准匹配的網頁內容。
當年百度搜索的PM內部還會舉辦比賽,試圖不斷尋找更快搜到目標資料的方法。
後來用戶的需求越來越強,從關鍵詞檢索變成提問題,搜索演變成非對稱性匹配,即當用戶提問後,搜素引擎給出的是類似專家咨詢式的回答。打個比方,用戶問「明天天氣怎么樣?」,答案可能是「雷陣雨伴有短時大風」。這個回答中壓根沒有出現與問題交叉的關鍵詞。
該匹配模式要求搜索引擎對用戶問題及全網內容這兩端都要有更深入的「理解」。
這大概能解釋,爲什么2013年百度、谷歌、微軟都會不惜代價參與對「深度學習之父」傑夫·辛頓教授的公司的收購競拍。
當時辛頓教授剛剛取得深度神經網絡技術的重大突破,搜索巨頭是最早嗅到技術潛力的一批公司——深度學習有望提升搜索效率。事後看,搜索也爲深度學習提供了最早的應用落地場景。百度、谷歌都是最早布局深度學習的科技巨頭,百度大腦、谷歌大腦後來也都成爲頂級AI开放平台。
圖:傑夫·辛頓
大約從2018年、2019年开始,深度學習又迎來一輪突飛猛進,搜索引擎的語義變革繼續演進。谷歌、百度等搜索巨頭的大語言模型越來越大,模型能力越來越強,智能搜索引擎雛形已現。以百度爲例,其在2019年便推出文心大模型1.0,此後持續迭代到2.0、3.0版本。
正是基於這些積累,在ChatGPT發布後,谷歌和百度能很快推出Bard、文心一言。外界看似一夜間長出來的大模型產品,實則是搜索巨頭多年業務實踐積累的產物。
被ChatGPT搶了風頭後,谷歌CEO Sundar Pichai在一次採訪中不無憋屈地說,「實際上我們已經擁有AI模型十幾年了。」
百度創始人、董事長兼CEO李彥宏也在公开演講中數次強調,無論是哪家公司,都不可能靠突擊幾個月就能做出(文心一言)這樣的大語言模型。「深度學習、自然語言處理,需要多年的堅持和積累,沒法速成。」
02
搜索之變
搜索引擎發展到今天,已經成爲世界上規模最大的AI應用場景和成功的商業模式。
從技術演進來看,似乎也很難得出搜索被大模型顛覆的結論。如果說狹義的搜索只是一個「搜索框」,廣義的搜索則是用戶表達和機器反饋的一個過程,而搜索框、對話框只是不同的人機交互形式。
這也是肖陽爲什么會說GPT和搜索引擎目標一致的底層邏輯。甚至大模型會讓頭部搜索引擎在競爭格局中處於更加有利的位置,因爲搜索有馬太效應——擁有更多用戶、技術、數據和算力的公司,產品效果會越來越好。
全球至今只有美中俄韓4個國家擁有本土搜索引擎不是沒有道理的。作爲一項互聯網基礎設施,後來者很難顛覆格局。當然歐盟還是不信邪,2022年曾掏5800萬元試圖打造一個歐盟自己的开放搜索引擎,以替代谷歌,目前還沒有下文。
基礎大模型也有相似特點,跑在前面的會跑得越來越快。「百度一手有搜索,一手有文心一言大模型或者說生成式AI技術,就像同時持有倚天劍、屠龍刀,雙劍合璧會產生更大的價值。」在作此判斷的同時,肖陽也承認,頭部搜索引擎並不能因此在競爭中松懈半分,理應讓用戶體驗發生迅猛的變化。
「其實這個事很簡單,你讓用戶滿意了,用戶就留下來,你讓用戶感知到你能夠使他滿意,新用戶就會來,你讓他不滿意,他就會走。」
用李彥宏的話說:永遠不要以任何方式遏制用戶的需求表達。
用戶需求表達的升級,只能用技術的升級來回應。在生成式AI出現之前,用戶的需求表達方式已經呈現出越來越豐富、多元的趨勢,比如更多口語化、模糊化表達、對圖片和視頻類信息搜索需求上升。
對此,搜索引擎巨頭們紛紛在語意推理模型的基礎上強化跨模態能力,類似後來的GPT-4。
大語言模型的出現也把搜索引擎帶到更爲智能的階段——能聽會看,越來越懂用戶。過去人們調侃:谷歌可以給你10萬個答案,但是一個圖書管理員可以給你最爲精准的答案。如今,大模型讓搜索引擎解決問題的能力更強,並开始朝着廣義的搜索生成體驗演進。
從行業引領者百度最新探索的一系列路徑,我們可以看到這種演進趨勢的眉目。
通過「卷」起自己,百度把「極致滿足」比例提升爲搜索內部隱形OKR。
所謂極致滿足,就是在用戶問出一個問題後,看搜索引擎給出的首條回答能不能解決你的問題。
首條回答的形式不僅有文字,還有視頻,搜索引擎可以從一段視頻中抽取出關鍵摘要。比如當家長想找一部教小朋友畫畫的藝術動畫片,以前需要花時間去瀏覽、篩選、判斷和總結。而現在,百度搜索可以爲用戶整理多個答案,並標注每個答案被提到的次數,每個答案中還包含更豐富的內容,大大節省了家長的精力。
另外一個有意思的探索在於「權威回答」。ChatGPT出現後,人們在震撼之余很快發現,它還會一本正經地胡說八道。計算機「幻覺」的存在,讓部分內容的真實可信度打個問號。百度搜索的新功能,則可以引用書籍直接回答提問,以增加信任感。
當你問出某個問題,搜索引擎可能會告訴你在這個問題在哪本書裏寫過,隨後是進一步有拓展的閱讀,其相當於一個AI時代圖書管理員的角色。
肖陽透露,百度搜索一直在關注「極致滿足」數據:半年前,「首條滿足」比例只有40%;現在達到70%。且從數據變化來看,用戶是愿意爲搜索體驗的上升而买單的——今年以來,百度搜索日均新增問答需求超過5000萬次。
作爲搜索代際變革的一部分,能聽會看的「AI夥伴」也走上重要位置。百度在今年5月底的移動生態大會上首次演示了內測「AI夥伴」的能力。
現場Demo顯示中,它不只是一個聊天機器人的對話界面,還能幫助用戶標記答案重點、提供權威來源,總結文檔概要,同時支持調用各種工具和服務,以及根據用戶意圖制作圖片或進行文案創作。
據了解,這個「AI夥伴」目前還在內測當中,用戶的許多需求讓工程師意想不到,預計未來「AI夥伴」的能力都會持續演進。
不過未來會否進入比爾·蓋茨所預言的AI個人助理時代,最終還要依賴搜索引擎與大模型的融合程度。這條路徑充滿挑战,同時也被想象力鋪滿黃金。
03
新故事
在去年的一場媒體交流中,肖陽曾聊到一個問題:搜索做到最後,拼什么?
業內公認,搜索是互聯網領域難度最高的業務之一,它可是一個簡單的搜索框,也可能是一個非常开放的體系。但這個市場從來不乏挑战者。前兩年,字節、華爲等都有積極布局相關業務。彼時ChatGPT還沒有帶來顛覆性變革。
肖陽當時的回答是,最終拼對用戶的理解、對技術的投入以及能否把搜索做到極致的能力。如今大模型的智能湧現,讓所有人同時看到了做到極致的方向——搜索生成體驗,甚至輔助決策。
這些進化反過來不斷激發新的用戶需求。
大模型也讓百度搜索有了新故事。過去百度只是一個需求的「起點」,用戶獲取信息後,再去到其他網站或者App獲得服務場景,比如電商、本地生活或者內容創作。
爲了提升服務價值,百度陸續通過布局小程序、百家號等產品進一步豐富搜索的內容生態,希望以此讓用戶能夠一站式解決問題,享受閉環服務。放眼全球搜索行業,這種生態战略布局都有領先價值。
不過大模型出現以前,補齊理想的生態閉環需要更長的時間和耐心,因爲工具類產品都有用戶粘性和停留時長的挑战。
大模型加速了閉環的形成,它拉通了提問、找答案、決策落地的全過程,搜索引擎也因此獲得更大的商業想象力。這大概是所謂「雙劍合璧」的商業價值。
幾乎可以預見,融合更多人工智能創新應用後,搜索引擎們可能會打造一個更有活力的生態系統。
從百度等公司今年以來密集亮出的「武器庫」、「路线圖」來看,搜索主要玩家大概率不會被顛覆,相反會作爲顛覆式創新的主要參與者,繼續推動技術變革。
原文標題 : 大模型落地,搜索先成卷王
標題:大模型落地,搜索先成卷王
地址:https://www.utechfun.com/post/232809.html