大模型走到下半場,真正的“卷點”應該在哪?

2024-07-06 18:11:06    編輯: robot
導讀   來源:陸玖商業評論   一方面,讓普通人以更小的成本,去了解和使用大模型和AI應用;另一方面,企業也能在不斷的AI應用中,了解模型使用的具體場景,以及能帶來的實際價值。   自2022年底大語言...

  來源:陸玖商業評論

  一方面,讓普通人以更小的成本,去了解和使用大模型和AI應用;另一方面,企業也能在不斷的AI應用中,了解模型使用的具體場景,以及能帶來的實際價值。

  自2022年底大語言模型面世以來,全球範圍內便掀起了新一輪AI浪潮,有的甚至最快是“以周爲單位”進行產品迭代。

  根據一些公开資料,截至去年10月,國內發布的大模型就已超過230個,而6月份的時候這一數字還不到80個,短短4個月的時間就翻了近三倍。“百模趕考”實至名歸。

  然而行業走到今天,有不少從業者發現,大模型的終點並不在數量的多少,諸如“我們真的需要這么多模型嗎”“模型之間卷規模到底有沒有用”“那真正的卷點應該被設定在哪”等這般話題,正被業內反復討論。

  產生這種質疑之聲的原因,其實不難理解。畢竟放眼於應用層,除了基於开源大模型不斷調優的“套殼應用”,真正稱得上“能幹”的應用,卻是鳳毛麟角。

  這也正如百度創始人李彥宏在上海世界人工智能大會上所說的,“AI時代,‘超級能幹’的應用比只看DAU的‘超級應用’更重要。”換言之,在廣泛的、實際的場景中,企業真正需要的是超級能幹的應用,有能力去解決實際問題,而不只是一個看似很大的超級應用。

  隨着大模型“卷應用”的浪潮逐步在金融、交通、政務等領域落地开花,更多的人开始意識到,生成式AI的下半場,或許更大的機會在應用上。而中國的AI產業,有望從應用層實現彎道超車。

  01

  警惕“超級APP陷阱”

  從PC時代到移動互聯時代,互聯網產品的形態與發展路徑,是截然不同的。

  近二十年前,受限於通信技術與硬件水平,軟件產品的容量不可能做得太大,承載信息的能力自然也有限。

  隨着硬件算力和通信技術的發達,智能手機作爲應用終端,开始成爲信息集散地。在這個時代成長起來的互聯網大廠,無一不靠大DAU,大用戶量的“超級APP”,觸及用戶生活的方方面面。也據此完成了“前AI時代”的資本積累。

  當互聯網走入生成式AI時代,以往“一個超級APP”走天下的邏輯,是否還能通用?但如今,這也變成了一個值得商榷的問題。

  畢竟此前幾乎無人可以預見,在人工智能時代,用戶最常用的AI功能是什么。到目前爲止,C端用戶最常使用的AI功能,多用於文檔解析、初級文案生成,文生圖、文生視頻雖然在商業領域已經有初步引用,但水平依舊無法在短時間取代專業人士。

  基於同樣的原因,雖然底層模型已經初步產生馬太效應,資源和商業效益开始向頭部大廠聚集,但像移動互聯網時代超過1億日活的“現象級應用”,卻尚未誕生。其中一個原因,是大語言模型的所有能力,尚未被應用層开發者挖掘完畢。

  與之相對的是,除了少數行業人士,市場對於生成式AI應用的認知和關注點,更多落在基礎模型的進展上。而李彥宏和百度,則更多希望通過站位未來,來調控這艘大船今天的業務方向。

  相較於移動互聯網時代動輒比拼DAU規模,李彥宏認爲,不同時代下,應用的發展路徑和模式都是不一樣的。避免掉入“超級應用陷阱”,不要用移動時代的思維看問題,這是其在本次大會上給出的一個結論。

  在他看來,AI時代下,“超級能幹”的應用遠比只看DAU的“超級應用”,來得更加重要。“只要對產業、對應用場景能產生大的增益,整體的價值就比移動互聯網要大多了。”李彥宏如是說。

  仔細想來,其實這並不難理解。

  眼下及未來很長一段時間裏,如果再像移動互聯網時代那般,把絕大多數精力放在底層模型,一來,不斷地重復开發基礎大模型,也是對社會資源的極大浪費;二來,也是更重要的是,這或將錯失更大的機會,特別是錨定產業價值層面的機會。

  02

  卷模型與卷應用,從來不是二選一

  在人們討論AI大模型數量過多的時候,伴生而來還會注意到另一個現象:數百個大模型問世,這些大模型之間的差異性到底體現在哪兒?而僅從國內生成式AI的競爭演變,就能看出這個情況——

  過去一年多,無論是模型層還是應用層,都出現了從“百模大战”到“補貼大战”的轉變,起碼在底層模型層,行業已經出現相對飽和;另一方面,行業出清的跡象已經產生。以文心一言爲代表的世界領先水平的一批國產大模型已經出現。

  從過往連篇累牘的報道中也能發現,從無到有訓練一個底層大模型,數億乃至數十億的資本投入、一卡難求的算力投入、可遇而不可求的AI細分行業人才,只是萬裏長徵第一步。後續的模型迭代、生態培養等成本,遠非中小AI團隊可以承擔。

  正因如此,對於行業的大多數人來說,除非是成規模的大廠,抑或是拿到“龍傲天”劇本的明日之星,卷模型都是一個“無底洞”。無論是積累用戶,抑或是解決實際場景下的實際問題,都是應用層的機會更大。

  而在這個過程中,行業大模型有關开源、閉源誰更具有優勢的爭辯,一直未曾停止。

  支持开源的行業人士認爲,开源模型的意義,在於所有團隊都站在一個起跑线上,拿着同樣的廚具和食材,能炒出什么樣的菜,各憑本事,這是一種公平競爭。

  但大模型的开源,或許與一般意義上的軟件开源,存在根本上的差異。譬如一般軟件开源時,开發者可以獲取軟件的源代碼,並據此修改或者增加新功能。

  大模型內部代碼,則分爲預訓練代碼、微調代碼和推理代碼三層,對於微調代碼,市場上已有很多公开方法。而大模型要被用起來,需要推理代碼,至於訓練過程和數據集,往往也是大模型廠商的核心所在。此外還有算力層面的考量。

  在這種背景下,擁有經驗證商業模式的閉源模型,更適合在競爭激烈的大模型行業裏聚集人才和算力,進而實現商業化落地。這也是李彥宏的判斷。

  盡管在大會上,他並未否定开源在某些環境中的使用價值,但他也提到,“當你處在一個激烈競爭的市場環境當中的時候,你需要是讓自己業務的效率比你的同行更高,成本比你的同行更低,這個時候商業化的閉源模型是最能打的。”

  當然更值得強調的是,“沒有應用,光有基礎模型,不管是开源還是閉源都一文不值。所以,我從去年下半年就开始講大家不要卷模型了,要去卷應用。”

  李彥宏透露,在更通用的領域當中,比如說代碼生成,像文心快碼這樣的軟件,在不同的領域正在逐步的滲透,“而在百度內部,我們有30%左右的代碼,已經用AI生成的,代碼的採用率超過了44%。”

  03

  下一個爆發點在哪?

  無論是重構的百度文庫,抑或是作爲底層模型能力終端的文心一言,都只是生成式AI應用落地的初步形態。在李彥宏看來,智能體是大模型落地最有前景的發展方向,也被認爲是最接近AGI的方向。

  從具體功能來看,智能體不止有對話能力、還有反思、協作能力。在未來的行業應用上,多個智能體協作,去解決復雜的任務,將是非常前沿的技術趨勢。某種意義上說,這也是“超級能幹”的又一種體現。

  “制作一個好的智能體通常並不需要編碼,只要用人話把智能體的工作流說清楚,再配上專有的知識庫,一般就是一個很有價值的智能體了。”隨着基礎模型的日益強大,开發應用也越來越簡單了,智能體也成爲李彥宏最看好的AI應用方向之一。

  事實上,百度對於智能體的布局較早。早在去年4月份,基於文心一言的文心智能體已經上线。今年6月,中國工程院朱有勇院士及團隊與百度共同打造的首個農業智能體——“農民院士智能體”正式發布。

  智能體學習朱有勇院士的研究成果以及相關的農業知識之後,農民只需通過簡單的提問,就能得到關於旱地稻種植條件、培育技術、病蟲害防治等實際問題的專業解答。

  值得一提的是,在文心智能體的平台上,已經有16萬多名开發者和超5萬家企業入駐,覆蓋了100多個應用場景,智能體生態已然初具規模。

  在無數個細分領域,隨着各行各業對於生成式AI的理解不斷加深,基於閉源小模型的智能體,也將爲行業增效發揮巨大作用。企業多數重復瑣碎的工作,將會被“超級能幹”的智能體所替代,人類大腦深處的潛能,將會投入到更具創造性的工作中去。

  而這,就是“超級能幹”的大模型應用落地的價值內核:一方面,讓普通人以更小的成本,去了解和使用大模型和AI應用;另一方面,企業也能在不斷的AI應用中,了解模型使用的具體場景,以及能帶來的實際價值。

  真相無法揭露,只能接近

  作者 : 胡家銘  監制 : 大曼 排版 : 洋洋



標題:大模型走到下半場,真正的“卷點”應該在哪?

地址:https://www.utechfun.com/post/393552.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡