年終盤點：AI大模型今年有哪些變化？

2024-12-13 18:42:02 編輯： robot

導讀 2024年，大模型市場可謂熱鬧非凡，一方面，各大廠商紛紛將目光投向具體應用場景，推動行業定制化的大模型加速落地，這些模型正逐步滲透到金融、醫療、教育等多個關鍵行業中，爲解決專業領域的復雜問題提供了方...

2024年，大模型市場可謂熱鬧非凡，一方面，各大廠商紛紛將目光投向具體應用場景，推動行業定制化的大模型加速落地，這些模型正逐步滲透到金融、醫療、教育等多個關鍵行業中，爲解決專業領域的復雜問題提供了方法。另一方面，關於大模型未來發展路徑的討論持續升溫，圍繞商業化落地、大模型與小模型的選擇、應用的方向等成爲業界關注的重點話題。

那么相比於2023年，2024年大模型行業發生了哪些變化呢？

01. 理念上：從月亮到六便士，市場越來越關注投資回報

2024年大模型行業的一大變化就是市場越來越務實，越來越重視商業化落地程度。時間回到一年前，中國創投圈洋溢着久違的亢奮，從线上的媒體、社區，到线下咖啡館，每個人都在談論着OpenAI、大模型以及對未來AI世界的暢想。許多已功成名就、處於半隱退狀態的明星創業者，如李开復、王小川、王慧文等，也不甘心錯過這次難得的技術浪潮，再次出山。

而現在這股亢奮的情緒开始退潮。不少投資人的耐心逐正在逐漸被消耗，與企業之間的關系產生了裂痕。今年11月，大模型明星創業公司“月之暗面”與前投資人“反目”，走到仲裁的事件在業內引起廣泛關注。

根據桔子IT數據，今年以來(1月1日~12月5日)，國內AI領域發生439起融資案例，總融資金額超564億元，大概是去年的80%。粗估來看，今年以來AI領域月均融資金額不到50億元。並且機構縮減投資是普遍現象。據清科研究中心不完全統計，今年上半年國內對外投資活動的早期投資、VC、PE機構數量同比分別減少23.9%、19.2%、25.2%。

因此如果說2023年，各家大模型廠商們都在專注於打磨模型參數、模型性能、榜單排名等各個方面的能力，爭相渴望成爲“中國的OpenAI”，那么2024年，越來越多的人變得更加務實，开始更關注落地場景和商業化。

尤其是進入今年下半年，整個行業的風向更加微妙。市場逐漸對大模型祛魅，資本也回歸理性，行業的兩股勢力也發生了站位的轉換。

一邊是阿裏、字節等巨頭投入的動作明顯加快，收編大模型創業公司的核心人才，推出一系列AI產品；一邊是創業公司开始重新評估自身的路线，國內“AI六小虎”有兩家逐步放棄預訓練模型，業務重心轉向AI應用。

“AI大模型(賽道)，將只剩下10家企業扮演重要角色。”中國工程院外籍院士張亞勤曾表示。這幾乎是行業的共識，最後的勝利屬於少數的玩家。

大模型最終會進化成什么樣，還不確定，但可以確定的是，大模型浪潮下，技術仍在迭代，場景仍在驚豔，商業化也始終在探索的路上。

02. 路线上：從堆算力到強化邏輯學習，從大模型到小模型

2024年大模型行業的第二大變化就是技術路线上不再僅僅是堆算力，而是探索強化學習、知識計算、符號推理、類腦計算及其他新型路徑。其中投入更小，更垂直的小模型不斷湧現。

近年來，大模型發展迅速，以其出色的性能，在語音識別、自然語言處理、圖像識別等多個領域取得了顯著成果。這些大模型通過深度學習技術，能夠處理海量的數據，並從中提取出有價值的特徵和信息，爲各種應用場景提供強大的支持。特別是在金融、醫療、教育等行業，大模型的應用已經逐漸深入到核心業務領域，成爲推動企業創新發展的重要動力。

然而，大模型的發展也面臨着一些挑战。首先，大模型的訓練和推理需要消耗大量的計算資源，這使得其成本高昂，且只有少數大型企業能夠承擔。其次，大模型在處理特定領域的問題時，往往需要大量的數據進行微調，以適應不同的應用場景。此外，隨着大模型規模的不斷擴大，其可解釋性和隱私保護問題也日益凸顯。

並且單純擴大規模，存在幻覺、效率、可信、安全等瓶頸，現在讓一個大模型做一個奧數題和計算2+2這樣簡單的算術題，需要的運算量、運算次數是一樣的。所以，我們能否把大模型做得更安全、更高效，更好解決現在存在的一些瓶頸？

需要指出的是本輪的AI浪潮，核心其實是LLM，即語言大模型——參數量數十億乃至上百億，需要專門的GPU集群，訓練成本極高——真正能跑出來的產品，無一例外，都是用真金白銀堆砌起來的。

但AI顯然是要普及的，封閉、資本密集的大模型並不符合這樣的大趨勢。於是乎，开源的小模型成爲了新的熱點——大模型的體量，使得它在手機、物聯網設備等小型終端上部署起來頗爲麻煩，但小模型則不同。尤其是那些要求快速反應的領域，比如語音和圖像的識別處理，小模型的處理效率也會更快——某種程度上說，小模型相當於是大模型的精華版。

相較於大模型，小模型在特定場景下展現出了獨特的優勢。一是小模型具有較低的計算復雜度和資源消耗，這使得其能夠在資源受限的環境下運行，如移動設備、邊緣計算節點等。二是小模型往往針對特定任務進行優化，因此在某些應用場景下能夠取得與大模型相近甚至更好的性能。三是小模型的可解釋性較強，更易於被用戶理解和接受。以openai的GPT-4o mini來說，成本下降的情況下，質量反而更高，這就是數據集和訓練方式改變後帶來的突破。

03. 應用上：從對話到多元應用，AI Agent、具身智能等湧現

2024年大模型行業的第三大變化就是應用不斷迭代。根據lifearchitect.ai數據，截至目前，全球總共有467個大模型。新技術不斷湧現，行業競速賽愈演愈烈，大模型廠商都在不斷迭代升級，旨在離AGI更進一步。進入到今年，除了應用上的百家爭鳴，一個明顯的變化在於，以ChatGPT爲代表的大語言模型局限性日益顯現。

例如，他們只能處理文本領域的任務，無法與物理和社會環境進行互動；雖然大模型語料庫已經十分豐富，但關於人類的價值觀的文本，他們並不具備理解能力。

在此前提下，OpenAI今年9月推出的o1系列模型重點在於會思考。彼時，OpenAI CEO奧特曼對o1信心滿滿，“我認爲這次 o1 模型發布最重要的信息是，AI 發展不僅沒有放緩，而且我們對未來幾年已經勝券在握。”

與GPT系列模型不同，o1系列模型有更強大的“思路鏈”，模型會在思考後回答用戶問題，輸出高質量的內容，而非迅速回應無效回答。此外，o1系列更擅長推理，推理能力大幅提升，特別是在奧數、編程等領域展現出了優勢。

行業風向標的新動作，引發國內大模型廠商的追趕。11月16日，月之暗面公布了k0 math；11月20日，Deepseek上线DeepSeek-R1-Lite大模型；11月27日，昆侖萬維推出“天工大模型 4.0” o1 版……無一不在強調大模型的邏輯思考能力。

與此同時，到了今年下半年，幾乎人人都在談“AI Agent”(人工智能代理，也可稱爲“智能體”)。在海外市場，微軟、蘋果、谷歌、OpenAI、Anthropic等科技巨頭紛紛公布相關進展；在國內市場，百度、阿裏、騰訊、智譜、榮耀、聯想等一衆廠商的智能體平台也紛至杳來，一場圍繞“AI Agent”的爭奪战正悄然开啓。

所謂“AI Agent”，OpenAI將“AI Agent”定義爲以LLM爲大腦驅動，具有自主理解、感知、規劃、記憶和使用工具的能力，能自動化執行復雜任務的系統。不同於傳統人工智能，AI Agent 具備通過獨立思考、調用工具去逐步完成給定目標的能力。

舉個簡單的例子，如果用戶想要進行一次家庭聚餐，LLM可以爲其提供就餐地點和店鋪相關信息提示，而AI Agent不僅能夠提供擇店鋪建議，還能基於用戶預算搜索菜系和店鋪，執行預訂操作，並將行程添加到日歷，還可以發送行程提醒。

有觀點認爲，‌AI Agent的出現是爲了解決LLM在具體應用場景中的局限性。LLM雖然具備了一定的智能，能夠生成文本、圖片和視頻等內容，但其功能相對有限，無法獨立完成復雜的任務。AI Agent作爲大模型的上層應用，能夠通過感知環境、進行決策和執行動作，幫助大模型實現更多的功能，從而更好地爲各行各業賦能。

此外具身智能也是大模型應用的一大分支。所謂具身智能是指將人工智能(AI)融入機器人等物理實體，賦予它們具有像人類一樣的感知、學習和與環境動態交互的能力。在生活中，可感知周邊環境的智能掃地機器人、已進入路測的自動駕駛汽車，都可被視爲具身智能的雛形，而人形機器人則是具身智能最理想的載體。

以上種種，其實都可以視爲行業在爲大模型尋找最適合的“殺手級”應用。

04. 結語：朝着AGI的星辰大海，不斷前進

綜上，無論是理念的變化，亦或是路线的選擇，還是應用的迭代，最終的目的就是一個——走向AGI(通用人工智能)。

所謂AGI，即能夠執行任何智能任務的人工智能，是人類智慧的延伸，也是未來科技的燈塔。它不僅僅是對特定任務的自動化，而是對人類智能的全面模擬，包括學習、推理、規劃、感知、語言理解和創造力等。在這條道路上，我們正逐步攻克技術難題，從深度學習到神經網絡，從自然語言處理到機器視覺，每一次技術的突破都是朝着AGI目標邁進的一大步。科學家們在算法優化、數據集構建、硬件加速等方面不懈努力，以期構建出更加智能、更加靈活、更加接近人類思維的AI系統。

盡管挑战重重，但人類對知識和智慧的追求從未停止。筆者相信，隨着技術的不斷進步和人類智慧的不斷積累，AGI終將成爲現實。它將幫助我們解決復雜的問題，提高生活質量，甚至开啓人類文明的新篇章。而在這個過程中，我們不僅要追求技術的極致，更要思考如何讓技術更好地服務於人類，如何確保AGI的發展能夠促進社會的公平與和諧。