2024年,大模型市場可謂熱鬧非凡,一方面,各大廠商紛紛將目光投向具體應用場景,推動行業定制化的大模型加速落地,這些模型正逐步滲透到金融、醫療、教育等多個關鍵行業中,爲解決專業領域的復雜問題提供了方法。另一方面,關於大模型未來發展路徑的討論持續升溫,圍繞商業化落地、大模型與小模型的選擇、應用的方向等成爲業界關注的重點話題。
那么相比於2023年,2024年大模型行業發生了哪些變化呢?
01. 理念上:從月亮到六便士,市場越來越關注投資回報
2024年大模型行業的一大變化就是市場越來越務實,越來越重視商業化落地程度。時間回到一年前,中國創投圈洋溢着久違的亢奮,從线上的媒體、社區,到线下咖啡館,每個人都在談論着OpenAI、大模型以及對未來AI世界的暢想。許多已功成名就、處於半隱退狀態的明星創業者,如李开復、王小川、王慧文等,也不甘心錯過這次難得的技術浪潮,再次出山。
而現在這股亢奮的情緒开始退潮。不少投資人的耐心逐正在逐漸被消耗,與企業之間的關系產生了裂痕。今年11月,大模型明星創業公司“月之暗面”與前投資人“反目”,走到仲裁的事件在業內引起廣泛關注。
根據桔子IT數據,今年以來(1月1日~12月5日),國內AI領域發生439起融資案例,總融資金額超564億元,大概是去年的80%。粗估來看,今年以來AI領域月均融資金額不到50億元。並且機構縮減投資是普遍現象。據清科研究中心不完全統計,今年上半年國內對外投資活動的早期投資、VC、PE機構數量同比分別減少23.9%、19.2%、25.2%。
因此如果說2023年,各家大模型廠商們都在專注於打磨模型參數、模型性能、榜單排名等各個方面的能力,爭相渴望成爲“中國的OpenAI”,那么2024年,越來越多的人變得更加務實,开始更關注落地場景和商業化。
尤其是進入今年下半年,整個行業的風向更加微妙。市場逐漸對大模型祛魅,資本也回歸理性,行業的兩股勢力也發生了站位的轉換。
一邊是阿裏、字節等巨頭投入的動作明顯加快,收編大模型創業公司的核心人才,推出一系列AI產品;一邊是創業公司开始重新評估自身的路线,國內“AI六小虎”有兩家逐步放棄預訓練模型,業務重心轉向AI應用。
“AI大模型(賽道),將只剩下10家企業扮演重要角色。”中國工程院外籍院士張亞勤曾表示。這幾乎是行業的共識,最後的勝利屬於少數的玩家。
大模型最終會進化成什么樣,還不確定,但可以確定的是,大模型浪潮下,技術仍在迭代,場景仍在驚豔,商業化也始終在探索的路上。
02. 路线上:從堆算力到強化邏輯學習,從大模型到小模型
2024年大模型行業的第二大變化就是技術路线上不再僅僅是堆算力,而是探索強化學習、知識計算、符號推理、類腦計算及其他新型路徑。其中投入更小,更垂直的小模型不斷湧現。
近年來,大模型發展迅速,以其出色的性能,在語音識別、自然語言處理、圖像識別等多個領域取得了顯著成果。這些大模型通過深度學習技術,能夠處理海量的數據,並從中提取出有價值的特徵和信息,爲各種應用場景提供強大的支持。特別是在金融、醫療、教育等行業,大模型的應用已經逐漸深入到核心業務領域,成爲推動企業創新發展的重要動力。
然而,大模型的發展也面臨着一些挑战。首先,大模型的訓練和推理需要消耗大量的計算資源,這使得其成本高昂,且只有少數大型企業能夠承擔。其次,大模型在處理特定領域的問題時,往往需要大量的數據進行微調,以適應不同的應用場景。此外,隨着大模型規模的不斷擴大,其可解釋性和隱私保護問題也日益凸顯。
並且單純擴大規模,存在幻覺、效率、可信、安全等瓶頸,現在讓一個大模型做一個奧數題和計算2+2這樣簡單的算術題,需要的運算量、運算次數是一樣的。所以,我們能否把大模型做得更安全、更高效,更好解決現在存在的一些瓶頸?
需要指出的是本輪的AI浪潮,核心其實是LLM,即語言大模型——參數量數十億乃至上百億,需要專門的GPU集群,訓練成本極高——真正能跑出來的產品,無一例外,都是用真金白銀堆砌起來的。
但AI顯然是要普及的,封閉、資本密集的大模型並不符合這樣的大趨勢。於是乎,开源的小模型成爲了新的熱點——大模型的體量,使得它在手機、物聯網設備等小型終端上部署起來頗爲麻煩,但小模型則不同。尤其是那些要求快速反應的領域,比如語音和圖像的識別處理,小模型的處理效率也會更快——某種程度上說,小模型相當於是大模型的精華版。
相較於大模型,小模型在特定場景下展現出了獨特的優勢。一是小模型具有較低的計算復雜度和資源消耗,這使得其能夠在資源受限的環境下運行,如移動設備、邊緣計算節點等。二是小模型往往針對特定任務進行優化,因此在某些應用場景下能夠取得與大模型相近甚至更好的性能。三是小模型的可解釋性較強,更易於被用戶理解和接受。以openai的GPT-4o mini來說,成本下降的情況下,質量反而更高,這就是數據集和訓練方式改變後帶來的突破。
03. 應用上:從對話到多元應用,AI Agent、具身智能等湧現
2024年大模型行業的第三大變化就是應用不斷迭代。根據lifearchitect.ai數據,截至目前,全球總共有467個大模型。新技術不斷湧現,行業競速賽愈演愈烈,大模型廠商都在不斷迭代升級,旨在離AGI更進一步。進入到今年,除了應用上的百家爭鳴,一個明顯的變化在於,以ChatGPT爲代表的大語言模型局限性日益顯現。
例如,他們只能處理文本領域的任務,無法與物理和社會環境進行互動;雖然大模型語料庫已經十分豐富,但關於人類的價值觀的文本,他們並不具備理解能力。
在此前提下,OpenAI今年9月推出的o1系列模型重點在於會思考。彼時,OpenAI CEO奧特曼對o1信心滿滿,“我認爲這次 o1 模型發布最重要的信息是,AI 發展不僅沒有放緩,而且我們對未來幾年已經勝券在握。”
與GPT系列模型不同,o1系列模型有更強大的“思路鏈”,模型會在思考後回答用戶問題,輸出高質量的內容,而非迅速回應無效回答。此外,o1系列更擅長推理,推理能力大幅提升,特別是在奧數、編程等領域展現出了優勢。
行業風向標的新動作,引發國內大模型廠商的追趕。11月16日,月之暗面公布了k0 math;11月20日,Deepseek上线DeepSeek-R1-Lite大模型;11月27日,昆侖萬維推出“天工大模型 4.0” o1 版……無一不在強調大模型的邏輯思考能力。
與此同時,到了今年下半年,幾乎人人都在談“AI Agent”(人工智能代理,也可稱爲“智能體”)。在海外市場,微軟、蘋果、谷歌、OpenAI、Anthropic等科技巨頭紛紛公布相關進展;在國內市場,百度、阿裏、騰訊、智譜、榮耀、聯想等一衆廠商的智能體平台也紛至杳來,一場圍繞“AI Agent”的爭奪战正悄然开啓。
所謂“AI Agent”,OpenAI將“AI Agent”定義爲以LLM爲大腦驅動,具有自主理解、感知、規劃、記憶和使用工具的能力,能自動化執行復雜任務的系統。不同於傳統人工智能,AI Agent 具備通過獨立思考、調用工具去逐步完成給定目標的能力。
舉個簡單的例子,如果用戶想要進行一次家庭聚餐,LLM可以爲其提供就餐地點和店鋪相關信息提示,而AI Agent不僅能夠提供擇店鋪建議,還能基於用戶預算搜索菜系和店鋪,執行預訂操作,並將行程添加到日歷,還可以發送行程提醒。
有觀點認爲,AI Agent的出現是爲了解決LLM在具體應用場景中的局限性。LLM雖然具備了一定的智能,能夠生成文本、圖片和視頻等內容,但其功能相對有限,無法獨立完成復雜的任務。AI Agent作爲大模型的上層應用,能夠通過感知環境、進行決策和執行動作,幫助大模型實現更多的功能,從而更好地爲各行各業賦能。
此外具身智能也是大模型應用的一大分支。所謂具身智能是指將人工智能(AI)融入機器人等物理實體,賦予它們具有像人類一樣的感知、學習和與環境動態交互的能力。在生活中,可感知周邊環境的智能掃地機器人、已進入路測的自動駕駛汽車,都可被視爲具身智能的雛形,而人形機器人則是具身智能最理想的載體。
以上種種,其實都可以視爲行業在爲大模型尋找最適合的“殺手級”應用。
04. 結語:朝着AGI的星辰大海,不斷前進
綜上,無論是理念的變化,亦或是路线的選擇,還是應用的迭代,最終的目的就是一個——走向AGI(通用人工智能)。
所謂AGI,即能夠執行任何智能任務的人工智能,是人類智慧的延伸,也是未來科技的燈塔。它不僅僅是對特定任務的自動化,而是對人類智能的全面模擬,包括學習、推理、規劃、感知、語言理解和創造力等。在這條道路上,我們正逐步攻克技術難題,從深度學習到神經網絡,從自然語言處理到機器視覺,每一次技術的突破都是朝着AGI目標邁進的一大步。科學家們在算法優化、數據集構建、硬件加速等方面不懈努力,以期構建出更加智能、更加靈活、更加接近人類思維的AI系統。
盡管挑战重重,但人類對知識和智慧的追求從未停止。筆者相信,隨着技術的不斷進步和人類智慧的不斷積累,AGI終將成爲現實。它將幫助我們解決復雜的問題,提高生活質量,甚至开啓人類文明的新篇章。而在這個過程中,我們不僅要追求技術的極致,更要思考如何讓技術更好地服務於人類,如何確保AGI的發展能夠促進社會的公平與和諧。
原文標題 : 年終盤點:AI大模型今年有哪些變化?
標題:年終盤點:AI大模型今年有哪些變化?
地址:https://www.utechfun.com/post/454206.html