大模型狂飆一整年後,2024年應關注哪些關鍵點?

2023-12-22 18:40:16    編輯: robot
導讀 做大模型的企業那么多,能實現產業化的鳳毛麟角。 2023年接近尾聲,AI大模型的熱度絲毫不減。 谷歌剛宣布爲开發人員提供新版Gemini大模型並承諾降低使用成本,微軟就推出了擁有27億參數的全新語言...

做大模型的企業那么多,能實現產業化的鳳毛麟角。

2023年接近尾聲,AI大模型的熱度絲毫不減。

谷歌剛宣布爲开發人員提供新版Gemini大模型並承諾降低使用成本,微軟就推出了擁有27億參數的全新語言模型Phi-2。在頭部巨頭動作頻頻時,腰部玩家开始抱團,比如百奧幾何與智譜AI开始共建自然語言-生命語言多模態大模型。

雖然百度等巨頭早在2019年前後就已布局大模型技術,但2023年確實算得上是“大模型元年”,幾乎所有頭部科技大廠都深度參與研發,熱錢不斷湧入,將“千模大战”推向新的高潮。然而,在大模型“軍備競賽”之余,業內出現了越來越多的冷思考:基礎大模型越來越多,能實現產業化落地爲何寥寥無幾?2024年,AI技術產品化、產業化以及商業化,將是大模型發展的重中之重。

(圖片來自UNsplash)

“千模大战”高潮迭起,產業化成頭號難題

從參與企業規模、大模型數量與市場規模來看,中國已是僅次於美國的全球第二大大模型產業中心。

作爲國產大模型的“扛旗者”,李彥宏在上個月的西麗湖論壇上提及一組數據:截止今年10月國內發布的大模型多達238個,較6月翻了整整三倍,Hugging Face平台上可供下載的文本生成大模型則接近3萬個。按比例劃分,美、中兩國已上线/在研大模型數量佔到全球的80%以上,吊打其他國家或地區。

據速途網測算,2023年中國大模型市場規模約爲147億元,同比翻了一倍,預計在2028年將突破千億大關。龐大的市場規模,巨頭的高度重視,誘惑着資本不斷加大投入;AI對提升生產效率與經濟質量有着重要意義,一定程度關系到國家核心競爭力,因此也得到了有關部門高度重視。可以說,大模型狂飆一整年,離不开政策的支持、巨頭的重視和資本的熱情。

在大模型技術有序發展上我國走在世界前列,網信辦等七部委聯合發布的《生成式人工智能服務管理暫行辦法》、北京科委發布的《北京市促進通用人工智能創新發展的若幹措施(2023-2025)(徵求意見稿)》等中央和地方政府扶持措施相繼出爐,爲大模型的發展掃清障礙,既提供必要資源傾斜,也避免技術無序發展。

資本方面,百度、阿裏、騰訊、字節、科大訊飛、美團、京東、網易等大廠均在布局大模型技術,有實力的初創企業則成了VC們爭搶的香饃饃,熱錢不斷湧入。中國新一代人工智能發展战略研究院的報告顯示,截止10月底,國內已有38起大模型投融資事件,現存AI企業已超過2200家。

(圖片來自貝殼財經)

而在技術層面,文心大模型、阿裏通義、訊飛星火、智譜等國產基礎大模型在多個榜單上的評測均位居前列,一定程度上已能與GPT PK。

大模型行業欣欣向榮,但依然存在一些隱憂——比如困擾大部分從業者的產業化落地問題。任何前沿技術都要轉化爲產品或者說應用才能爲人所用,才能發揮價值。AI大模型當前在基礎技術迎頭直追的同時,更需要深入到產業端的場景中,在企業的生產經營中,或者用戶的生活學習中發揮作用。事實上,後者正是中國AI產業一直以來的優勢:相較於下棋、畫畫、作詩而言,中國科技從業者更接地氣,善於將技術應用到場景中,讓其爲產品、應用或者服務所用——哪怕沒那么炫酷也不重要。

三個標杆案例,看大模型產業化落地之路

大模型產業化的難點很多,比如不同行業數字化程度參差不齊,不同規模、不同領域的企業對AI的應用需求、可承擔的成本,有顯著差別,這裏的成本除了資金等經濟成本外,還有應用AI技術改造業務的風險、時間與邊際成本。正因爲此,當前雖然很多企業都在關注大模型技術,但真正做到用大模型技術來改造業務甚至打造AI原生應用的企業,卻少之又少。

不過浪裏淘沙,我們也能看到一些大模型技術和產業結合的標杆案例。

1、度小滿軒轅大模型:國內首個开源金融大模型

數據驅動的金融業是數字化程度較高的產業,數據庫、存儲、服務器、自動化、信息安全等等數字化基礎設施,均是在金融業率先應用普及。在AI技術普及過程中,金融業很早就在積極探索將AI與客服、風控、授信、營銷等場景結合,降本增效的同時,提升客戶體驗。

2023年,大模型技術爆發。金融科技先鋒平台度小滿在5月就率先开源了國內首個千億級中文金融大模型“軒轅”;9月,“軒轅70B”开源开放可被自由下載和使用。作爲金融場景而生的行業大模型,軒轅在智能化能力、功能服務以及信息安全上均有很強的針對性。

這種針對性體現在多個方面:比如軒轅用來訓練的數據集包含大量機構研報、專業名詞、行情數據等金融行業資料,賦予了其極強的金融信息理解和處理能力。

在技術實力上,軒轅大模型不遑多讓。其已通過注冊會計師考試、銀行/證券/保險/基金/期貨從業資格、理財規劃師、經濟師等金融領域權威考試。而在清華大學、上海交大和愛丁堡大學聯合發布的C-Eval大語言模型測評榜單和微軟亞洲研究院、MBZUAI、上海交大聯合推出的CMMLU榜單中,軒轅均取得了國內所有开源模型排名第一的成績。C-Eval和CMMLU是目前較爲權威的兩大專業榜單,能夠同時奪得第一,對軒轅這樣的行業大模型來說絕對算得上好成績了。

度小滿軒轅大模型正在金融場景深入應用。

在內部,軒轅大模型已深入賦能度小滿營銷、客服、風控、辦公再到研發等場景,並已初見成效。在代碼助手方面,用大模型輔助生成的代碼,採納率能夠達到42%,幫助公司整體研發效率提升了20%;在客服領域,大模型推動服務效率提升了25%。在智能辦公領域,大模型目前的意圖識別准確率已達到97%。

度小滿向來都很重視金融科技能力對外輸出。度小滿CTO許冬亮透露,軒轅在5月开源時就有上百家金融機構發出試用申請。從企業客戶的反饋來看,軒轅大模型的專業能力有口皆碑,2.0版本上下文對話長度增加至8K,對“非利息收入增長趨勢”等金融業的深度問題也能給出專業解釋。

2、阿裏通義千問大模型,在電商行業貫徹“AI驅動”战略。

2023年阿裏巴巴有許多大的變動,“用戶爲先、AI驅動”成爲新的战略方向。4月11日發布通義千問大模型的時候,時任阿裏巴巴集團董事長、阿裏雲智能集團CEO張勇就表示“所有軟件都值得用大模型升級改造,阿裏所有產品都會接入通義千問。”

阿裏確實說到做到,作爲阿裏大本營的電商業務就早已全面AI化。以通義千問大模型爲基礎,淘天集團推出了一系列面向B、C兩端的AI工具。

面向B端的工具包括官方客服機器人、圖片智能生成、營銷投放自主監測等,今年雙11大促期間商家調用後台AI工具的次數超過15億次;面向C端則推出AI智能助手淘寶問問,上线兩個月受邀試用人數突破500萬。B端工具可提高商家經營效率、降低流量成本,C端功能則可顯著改善用戶體驗,在電商行業狂卷價格時形成差異化競爭力。

大模型與電商場景的結合,阿裏走得最快也最遠,馬雲在阿裏內網回帖中甚至提到了“AI電商”這一讓人耳目一新的概念。

爲了進一步強化大模型技術實力,以及深化AI與業務的融合,近日淘天集團被爆暗中組建新的AI團隊,高調高薪招聘AI頂尖人才,抓緊時間訓練針對電商產業的專屬大模型“圖靈”。根據淘天集團此前透露的消息,未來一年會向商家發布更多AI工具,包括AI开店、經營咨詢、智能周報等,服務範圍涉及商家日常經營的方方面面。在阿裏的推動下,大模型和電商產業的結合才剛剛开始。可以預見,2024年,頭部電商平台均會加碼“大模型電商”。

3、科大訊飛星火大模型:大模型+教育的標杆玩家。

科大訊飛的第一標籤是語音智能,第二標籤就是智能教育科技巨頭。在大模型技術出現前,科大訊飛在AI技術上就已耕耘多年,其相當一部分營收就來自智能教育服務,如口語評測、教育硬件等教育智能化服務。

在大模型技術爆發後,星火大模型和教育行業的結合更是轟轟烈烈。今年5月訊飛星火認知大模型1.0版本發布次日,帶飛了A股教育科技板塊,除了科大訊飛外,學大教育、行動教育、國新文化全跟着漲停,呈現出“星火燎原”之勢。

從1.0到3.0,訊飛星火大模型一直重點攻克代碼能力和多模態能力,並基於技術上的突破开發出更多針對學校、教育企業以及教師和學生群體的功能、應用。比如針對學校管理環節的學生及教師信息管理、離校申請審核功能,爲教師量身打造的教學課件制作助手,給學生提供的AI一對一啓發式對話功能等。與此同時,訊飛在其翻譯筆、錄音筆、學習機、辦公本等教育硬件上也在深入應用大模型技術,強化產品力,鞏固在這一品類上的優勢。

(圖片來自訊飛星火官網)

金融、電商與教育,三個行業的頭部玩家,均能在大模型的改造下獲得全新增長點,可見大模型產業化並非癡人說夢,而是必然趨勢。

大模型开卷2024:有無產業化祕訣?

度小滿、阿裏、科大訊飛們只是开了個好頭,大模型產業化程度依然有很大提升空間,特別是歷史悠久、數字化程度較低的農業、制造業、物流航運業、能源業等產業,更是亟需擁抱大模型技術提高生產效率,實現從數字化到智能化的跨越。鑑於此,加速AI技術產品化、產業化和商業化將是大模型行業在2024年的頭號任務。誰能率先跑通產業化落地路徑,誰就可以在“千模大战”中笑到最後。那么,標杆玩家們給大模型產業化帶來了什么啓示呢?

第一,不重復發明輪子,有針對性地選擇訓練參數和設計功能服務。

基礎大模型已經很多了,市面上缺的是能跟抗衡甚至超越GPT的頂尖基礎大模型,以及可讓千行百業更低成本、更低門檻、更快應用的“產業大模型”。而要做出強大的產業大模型,需要“既懂AI技術又是產業專家”。

度小滿就是一個很好的例子,一邊有背靠百度的AI技術底子,另一邊有深耕金融科技行業多年積攢下的產業認知、能力、場景、生態等資源。

據悉,軒轅雖是基於擁有1760億參數的Bloom大模型訓練而成,但也離不开度小滿這些年積累的千億tokens中文預訓練數據集,包括銀行、保險、基金等行業的基礎知識與巨量參數。因爲有後者,軒轅大模型才有遠超同類競品和通用大模型的金融信息處理能力,也才可以面向金融業的痛點場景提供針對性的功能服務。

第二,深入貼合行業需求“定制”大模型功能服務,而不是閉門造車。

技術類公司容易出現“拿着錘子找釘子”的問題,如果不能貼合真實需求,技術再強大都可能只是自嗨。

爲什么度小滿、阿裏和科大訊飛可以在大模型產業化上先嘗到甜頭?因爲阿裏本身就是電商產業的龍頭,度小滿從成立之日起一直深度參與國內科技金融行業建設,科大訊飛也深耕智能教育行業十數載,它們對相應行業理解非一般企業所能及。讀懂行業運作邏輯和深層次問題,就能洞悉企業、從業者的真正痛點,並給出行之有效的解決方案。

以度小滿爲例,基於的理解、生成、邏輯和記憶四個基礎能力,軒轅大模型融合金融行業的使用習慣、優化需求,提供了一系列針對性功能。比如個人信貸管理服務,軒轅大模型爲銀行客戶提供客戶歷史信息管理、用戶多層次需求分析功能,給用戶提供專業問題自然語言交互問答服務,充分提高雙方的處理效率。度小滿在服務金融機構和自有客戶時洞察了許多需求,才可以做出真正能用、有用、好用的金融大模型產品。

第三,衆人擡柴火焰高,大模型不是獨角戲,必須惠及行業參與者。

中小企業是產業鏈的主力軍,然而因爲受限於資金實力與人才資源,往往很難再第一時間應用新技術,特別是門檻很高的新技術。相較於深度學習而言,大模型需要巨量算力、巨量數據和巨量算法,門檻高出了許多,對很多企業來說有些可望不可即。這對頭部玩家來說是機遇所在,如果堅持普惠开放路线,既可讓大模型技術有“產業化”的落點,也可以在大模型產業化中獲取對應價值。

在度小滿和北大光華管理學院聯合舉辦的大模型技術與應用論壇上,度小滿CTO許冬亮就發表過類似觀點,他認爲大模型是中小金融機構突圍而出的機會,因爲它們可通過應用創新加快數字化、智能化升級進程,繼而跨越數字化鴻溝。

也不難發現,“开放”成了成功落地產業的大模型的最大公約數。度小滿的軒轅、阿裏的通義千問、科大訊飛的星火走的均是开源开放路线。正如許冬亮所言,將大模型能力开放給金融機構,不僅可以加快技術的推廣普及,還能降低使用門檻,是實現技術普惠的必然選擇。

跟區塊鏈等新興技術的曇花一現不同,大模型的熱度不會驟然下降。一方面,大模型技術在2024年將會縱深到更多產業,C端,大模型驅動的爆款現象級應用一定會出現,B端,大模型產業化的案例只會越來越多。另一方面,大模型技術本質是深度學習技術的延續。AI技術已發展10余年,未來幾十年都將是科技產業的基礎技術。大模型是AI浪潮上最大的一朵浪花,而AI浪潮,將持續澎湃。

    來源:雷科技

           原文標題 : 大模型狂飆一整年後,2024年應關注哪些關鍵點?



    標題:大模型狂飆一整年後,2024年應關注哪些關鍵點?

    地址:https://www.utechfun.com/post/307673.html

    鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

    猜你喜歡