大模型狂飆一整年後，2024年應關注哪些關鍵點？

2023-12-22 18:40:16 編輯： robot

導讀做大模型的企業那么多，能實現產業化的鳳毛麟角。 2023年接近尾聲，AI大模型的熱度絲毫不減。谷歌剛宣布爲开發人員提供新版Gemini大模型並承諾降低使用成本，微軟就推出了擁有27億參數的全新語言...

做大模型的企業那么多，能實現產業化的鳳毛麟角。

2023年接近尾聲，AI大模型的熱度絲毫不減。

谷歌剛宣布爲开發人員提供新版Gemini大模型並承諾降低使用成本，微軟就推出了擁有27億參數的全新語言模型Phi-2。在頭部巨頭動作頻頻時，腰部玩家开始抱團，比如百奧幾何與智譜AI开始共建自然語言-生命語言多模態大模型。

雖然百度等巨頭早在2019年前後就已布局大模型技術，但2023年確實算得上是“大模型元年”，幾乎所有頭部科技大廠都深度參與研發，熱錢不斷湧入，將“千模大战”推向新的高潮。然而，在大模型“軍備競賽”之余，業內出現了越來越多的冷思考：基礎大模型越來越多，能實現產業化落地爲何寥寥無幾？2024年，AI技術產品化、產業化以及商業化，將是大模型發展的重中之重。

（圖片來自UNsplash）

“千模大战”高潮迭起，產業化成頭號難題

從參與企業規模、大模型數量與市場規模來看，中國已是僅次於美國的全球第二大大模型產業中心。

作爲國產大模型的“扛旗者”，李彥宏在上個月的西麗湖論壇上提及一組數據：截止今年10月國內發布的大模型多達238個，較6月翻了整整三倍，Hugging Face平台上可供下載的文本生成大模型則接近3萬個。按比例劃分，美、中兩國已上线/在研大模型數量佔到全球的80%以上，吊打其他國家或地區。

據速途網測算，2023年中國大模型市場規模約爲147億元，同比翻了一倍，預計在2028年將突破千億大關。龐大的市場規模，巨頭的高度重視，誘惑着資本不斷加大投入；AI對提升生產效率與經濟質量有着重要意義，一定程度關系到國家核心競爭力，因此也得到了有關部門高度重視。可以說，大模型狂飆一整年，離不开政策的支持、巨頭的重視和資本的熱情。

在大模型技術有序發展上我國走在世界前列，網信辦等七部委聯合發布的《生成式人工智能服務管理暫行辦法》、北京科委發布的《北京市促進通用人工智能創新發展的若幹措施（2023-2025）（徵求意見稿）》等中央和地方政府扶持措施相繼出爐，爲大模型的發展掃清障礙，既提供必要資源傾斜，也避免技術無序發展。

資本方面，百度、阿裏、騰訊、字節、科大訊飛、美團、京東、網易等大廠均在布局大模型技術，有實力的初創企業則成了VC們爭搶的香饃饃，熱錢不斷湧入。中國新一代人工智能發展战略研究院的報告顯示，截止10月底，國內已有38起大模型投融資事件，現存AI企業已超過2200家。

（圖片來自貝殼財經）

而在技術層面，文心大模型、阿裏通義、訊飛星火、智譜等國產基礎大模型在多個榜單上的評測均位居前列，一定程度上已能與GPT PK。

大模型行業欣欣向榮，但依然存在一些隱憂——比如困擾大部分從業者的產業化落地問題。任何前沿技術都要轉化爲產品或者說應用才能爲人所用，才能發揮價值。AI大模型當前在基礎技術迎頭直追的同時，更需要深入到產業端的場景中，在企業的生產經營中，或者用戶的生活學習中發揮作用。事實上，後者正是中國AI產業一直以來的優勢：相較於下棋、畫畫、作詩而言，中國科技從業者更接地氣，善於將技術應用到場景中，讓其爲產品、應用或者服務所用——哪怕沒那么炫酷也不重要。

三個標杆案例，看大模型產業化落地之路

大模型產業化的難點很多，比如不同行業數字化程度參差不齊，不同規模、不同領域的企業對AI的應用需求、可承擔的成本，有顯著差別，這裏的成本除了資金等經濟成本外，還有應用AI技術改造業務的風險、時間與邊際成本。正因爲此，當前雖然很多企業都在關注大模型技術，但真正做到用大模型技術來改造業務甚至打造AI原生應用的企業，卻少之又少。

不過浪裏淘沙，我們也能看到一些大模型技術和產業結合的標杆案例。

1、度小滿軒轅大模型：國內首個开源金融大模型

數據驅動的金融業是數字化程度較高的產業，數據庫、存儲、服務器、自動化、信息安全等等數字化基礎設施，均是在金融業率先應用普及。在AI技術普及過程中，金融業很早就在積極探索將AI與客服、風控、授信、營銷等場景結合，降本增效的同時，提升客戶體驗。

2023年，大模型技術爆發。金融科技先鋒平台度小滿在5月就率先开源了國內首個千億級中文金融大模型“軒轅”；9月，“軒轅70B”开源开放可被自由下載和使用。作爲金融場景而生的行業大模型，軒轅在智能化能力、功能服務以及信息安全上均有很強的針對性。

這種針對性體現在多個方面：比如軒轅用來訓練的數據集包含大量機構研報、專業名詞、行情數據等金融行業資料，賦予了其極強的金融信息理解和處理能力。

在技術實力上，軒轅大模型不遑多讓。其已通過注冊會計師考試、銀行/證券/保險/基金/期貨從業資格、理財規劃師、經濟師等金融領域權威考試。而在清華大學、上海交大和愛丁堡大學聯合發布的C-Eval大語言模型測評榜單和微軟亞洲研究院、MBZUAI、上海交大聯合推出的CMMLU榜單中，軒轅均取得了國內所有开源模型排名第一的成績。C-Eval和CMMLU是目前較爲權威的兩大專業榜單，能夠同時奪得第一，對軒轅這樣的行業大模型來說絕對算得上好成績了。

度小滿軒轅大模型正在金融場景深入應用。

在內部，軒轅大模型已深入賦能度小滿營銷、客服、風控、辦公再到研發等場景，並已初見成效。在代碼助手方面，用大模型輔助生成的代碼，採納率能夠達到42%，幫助公司整體研發效率提升了20%;在客服領域，大模型推動服務效率提升了25%。在智能辦公領域，大模型目前的意圖識別准確率已達到97%。

度小滿向來都很重視金融科技能力對外輸出。度小滿CTO許冬亮透露，軒轅在5月开源時就有上百家金融機構發出試用申請。從企業客戶的反饋來看，軒轅大模型的專業能力有口皆碑，2.0版本上下文對話長度增加至8K，對“非利息收入增長趨勢”等金融業的深度問題也能給出專業解釋。

2、阿裏通義千問大模型，在電商行業貫徹“AI驅動”战略。

2023年阿裏巴巴有許多大的變動，“用戶爲先、AI驅動”成爲新的战略方向。4月11日發布通義千問大模型的時候，時任阿裏巴巴集團董事長、阿裏雲智能集團CEO張勇就表示“所有軟件都值得用大模型升級改造，阿裏所有產品都會接入通義千問。”

阿裏確實說到做到，作爲阿裏大本營的電商業務就早已全面AI化。以通義千問大模型爲基礎，淘天集團推出了一系列面向B、C兩端的AI工具。

面向B端的工具包括官方客服機器人、圖片智能生成、營銷投放自主監測等，今年雙11大促期間商家調用後台AI工具的次數超過15億次；面向C端則推出AI智能助手淘寶問問，上线兩個月受邀試用人數突破500萬。B端工具可提高商家經營效率、降低流量成本，C端功能則可顯著改善用戶體驗，在電商行業狂卷價格時形成差異化競爭力。

大模型與電商場景的結合，阿裏走得最快也最遠，馬雲在阿裏內網回帖中甚至提到了“AI電商”這一讓人耳目一新的概念。

爲了進一步強化大模型技術實力，以及深化AI與業務的融合，近日淘天集團被爆暗中組建新的AI團隊，高調高薪招聘AI頂尖人才，抓緊時間訓練針對電商產業的專屬大模型“圖靈”。根據淘天集團此前透露的消息，未來一年會向商家發布更多AI工具，包括AI开店、經營咨詢、智能周報等，服務範圍涉及商家日常經營的方方面面。在阿裏的推動下，大模型和電商產業的結合才剛剛开始。可以預見，2024年，頭部電商平台均會加碼“大模型電商”。

3、科大訊飛星火大模型：大模型+教育的標杆玩家。

科大訊飛的第一標籤是語音智能，第二標籤就是智能教育科技巨頭。在大模型技術出現前，科大訊飛在AI技術上就已耕耘多年，其相當一部分營收就來自智能教育服務，如口語評測、教育硬件等教育智能化服務。

在大模型技術爆發後，星火大模型和教育行業的結合更是轟轟烈烈。今年5月訊飛星火認知大模型1.0版本發布次日，帶飛了A股教育科技板塊，除了科大訊飛外，學大教育、行動教育、國新文化全跟着漲停，呈現出“星火燎原”之勢。

從1.0到3.0，訊飛星火大模型一直重點攻克代碼能力和多模態能力，並基於技術上的突破开發出更多針對學校、教育企業以及教師和學生群體的功能、應用。比如針對學校管理環節的學生及教師信息管理、離校申請審核功能，爲教師量身打造的教學課件制作助手，給學生提供的AI一對一啓發式對話功能等。與此同時，訊飛在其翻譯筆、錄音筆、學習機、辦公本等教育硬件上也在深入應用大模型技術，強化產品力，鞏固在這一品類上的優勢。

（圖片來自訊飛星火官網）

金融、電商與教育，三個行業的頭部玩家，均能在大模型的改造下獲得全新增長點，可見大模型產業化並非癡人說夢，而是必然趨勢。

大模型开卷2024：有無產業化祕訣？

度小滿、阿裏、科大訊飛們只是开了個好頭，大模型產業化程度依然有很大提升空間，特別是歷史悠久、數字化程度較低的農業、制造業、物流航運業、能源業等產業，更是亟需擁抱大模型技術提高生產效率，實現從數字化到智能化的跨越。鑑於此，加速AI技術產品化、產業化和商業化將是大模型行業在2024年的頭號任務。誰能率先跑通產業化落地路徑，誰就可以在“千模大战”中笑到最後。那么，標杆玩家們給大模型產業化帶來了什么啓示呢？

第一，不重復發明輪子，有針對性地選擇訓練參數和設計功能服務。

基礎大模型已經很多了，市面上缺的是能跟抗衡甚至超越GPT的頂尖基礎大模型，以及可讓千行百業更低成本、更低門檻、更快應用的“產業大模型”。而要做出強大的產業大模型，需要“既懂AI技術又是產業專家”。

度小滿就是一個很好的例子，一邊有背靠百度的AI技術底子，另一邊有深耕金融科技行業多年積攢下的產業認知、能力、場景、生態等資源。

據悉，軒轅雖是基於擁有1760億參數的Bloom大模型訓練而成，但也離不开度小滿這些年積累的千億tokens中文預訓練數據集，包括銀行、保險、基金等行業的基礎知識與巨量參數。因爲有後者，軒轅大模型才有遠超同類競品和通用大模型的金融信息處理能力，也才可以面向金融業的痛點場景提供針對性的功能服務。

第二，深入貼合行業需求“定制”大模型功能服務，而不是閉門造車。

技術類公司容易出現“拿着錘子找釘子”的問題，如果不能貼合真實需求，技術再強大都可能只是自嗨。

爲什么度小滿、阿裏和科大訊飛可以在大模型產業化上先嘗到甜頭？因爲阿裏本身就是電商產業的龍頭，度小滿從成立之日起一直深度參與國內科技金融行業建設，科大訊飛也深耕智能教育行業十數載，它們對相應行業理解非一般企業所能及。讀懂行業運作邏輯和深層次問題，就能洞悉企業、從業者的真正痛點，並給出行之有效的解決方案。

以度小滿爲例，基於的理解、生成、邏輯和記憶四個基礎能力，軒轅大模型融合金融行業的使用習慣、優化需求，提供了一系列針對性功能。比如個人信貸管理服務，軒轅大模型爲銀行客戶提供客戶歷史信息管理、用戶多層次需求分析功能，給用戶提供專業問題自然語言交互問答服務，充分提高雙方的處理效率。度小滿在服務金融機構和自有客戶時洞察了許多需求，才可以做出真正能用、有用、好用的金融大模型產品。

第三，衆人擡柴火焰高，大模型不是獨角戲，必須惠及行業參與者。

中小企業是產業鏈的主力軍，然而因爲受限於資金實力與人才資源，往往很難再第一時間應用新技術，特別是門檻很高的新技術。相較於深度學習而言，大模型需要巨量算力、巨量數據和巨量算法，門檻高出了許多，對很多企業來說有些可望不可即。這對頭部玩家來說是機遇所在，如果堅持普惠开放路线，既可讓大模型技術有“產業化”的落點，也可以在大模型產業化中獲取對應價值。

在度小滿和北大光華管理學院聯合舉辦的大模型技術與應用論壇上，度小滿CTO許冬亮就發表過類似觀點，他認爲大模型是中小金融機構突圍而出的機會，因爲它們可通過應用創新加快數字化、智能化升級進程，繼而跨越數字化鴻溝。

也不難發現，“开放”成了成功落地產業的大模型的最大公約數。度小滿的軒轅、阿裏的通義千問、科大訊飛的星火走的均是开源开放路线。正如許冬亮所言，將大模型能力开放給金融機構，不僅可以加快技術的推廣普及，還能降低使用門檻，是實現技術普惠的必然選擇。

跟區塊鏈等新興技術的曇花一現不同，大模型的熱度不會驟然下降。一方面，大模型技術在2024年將會縱深到更多產業，C端，大模型驅動的爆款現象級應用一定會出現，B端，大模型產業化的案例只會越來越多。另一方面，大模型技術本質是深度學習技術的延續。AI技術已發展10余年，未來幾十年都將是科技產業的基礎技術。大模型是AI浪潮上最大的一朵浪花，而AI浪潮，將持續澎湃。