逐鹿金融大模型

2023-08-11 18:40:22    編輯: robot
導讀 來源 | 零壹財經作者 | 沈拙言編審 | 趙金龍 在關於金融大模型的諸多討論中,“落地應用”成了最終關鍵詞。對金融業務而言,精准與安全合規是任何技術得以應用的最大前提。因此,金融大模型的應用便絕非...

來源 | 零壹財經作者 | 沈拙言編審 | 趙金龍

在關於金融大模型的諸多討論中,“落地應用”成了最終關鍵詞。對金融業務而言,精准與安全合規是任何技術得以應用的最大前提。因此,金融大模型的應用便絕非簡單的“拿來主義”,需要在通用基礎上結合業務需求反復精調,這也是當前金融大模型的主要發力點。

7月末,據騰訊研究院副祕書長楊望調研分析,國內參數在10億規模以上的大模型數量已由5月末的79個增加至116個,其中金融行業大模型約18個。

有觀點認爲,大模型的出現,可能會把金融機構的數字化轉型進程拉到同一起跑线,填補金融機構間的“轉型鴻溝”,這對中小金融機構來講是不容錯過的機遇。在保證信息精度與安全合規的前提下,搶先獲得金融業務場景的商用突破,成爲18家金融大模型研發機構競爭的決勝點。

 01 各顯神通搶賽道

3月底,全球最大的財經資訊公司彭博社發布擁有500億參數的大型語言模型——BloombergGPT,標志着全球首個金融大模型的誕生,也掀起了國內金融大模型的浪潮。

彭博社表示,該大模型在3630tokens金融數據集、3450億tokens公共數據集之上進行訓練,可全方位支持金融領域NLP(自然語言處理)任務,表現明顯優於其他類似規模的开放模型,在一般NLP基准上的表現也達到甚至超過平均水平。

BloombergGPT一聲炮響,給國內帶來了實踐方向。

圖1:國內主要金融大模型時間軸(不完全統計)

來源:零壹智庫

5月,大數據基礎軟件供應商星環科技推出第一款面向金融量化領域的生成式大語言模型“無涯Infinity”。據其介紹,無涯Transwarp Infinity支持股票、債券、基金、商品等市場事件的全面復盤、總結及演繹推理,以及政策研報的深度分析,爲基金經理提供決策輔助。

5月下旬,度小滿推出國內首個千億級中文金融大模型“軒轅”,該模型是在1760億參數的Bloom大模型基礎上訓練而來,聚焦於金融名詞理解、金融市場評論、金融數據分析和金融新聞理解等任務。度小滿CTO許冬亮表示,軒轅大模型基於度小滿實際業務場景積累的海量金融數據進行訓練,保證在提升金融能力的同時,不會損失通用能力。

6月,恆生電子發布金融行業大模型LightGPT。據其介紹,LightGPT使用了超4000億tokens的金融領域數據(包括資訊、公告、研報、結構化數據等)和超過400億tokens的語種強化數據(包括金融教材、金融百科、政府報告、法規條例等),並以之作爲大模型的二次預訓練語料,支持超過80+金融專屬任務指令微調。

6月29日,拓爾思發布拓天大模型,並面向媒體、金融、政務領域推出了三大行業大模型。在金融大模型上,公司基於自有的110億+金融主題數據、百億級產業指標數據、30億+產業要素明細數據、2億+產業動態本體、500+以上標引維度、10000+知識標引規則、10萬+產業標籤作爲專業訓練數據。就在日前,拓爾思發布公告,計劃募資18億元用於拓天行業大模型研發及AIGC應用產業化項目。

7月,馬上消費透露將正式發布自主大模型,聚焦“自主動態強化學習能力的大模型(AIGC+RLHF)、多種模型組合式的AI系統、多模態音視頻實時人機結合”三項核心關鍵能力,致力解決金融行業大模型在落地過程中的安全可控和隱私保護、基礎設施能力建設等方面的關鍵問題。

在金融大模型浪潮中,財富管理機構與運營商也不甘落後。海通證券、申萬宏源、廣發證券、興業證券、長江證券、西南證券、國海證券、國盛證券、華福證券、財達證券10家券商宣布成爲百度“文心一言”首批生態合作夥伴,以同花順、東方財富爲代表的財富管理運營商也公告稱將重點打造AI投顧平台,深入AIGC、交互式AI等領域的研究,完善內容生態構建,增強智能運營能力。

騰訊雲則瞄准金融安全領域,推出金融風控大模型,錨定機構交易、信貸、營銷等場景的風控需求。騰訊雲天御首席科學家李超認爲,風控尤其是貸前風控環節有着最緊迫的需求,在信貸領域,因黑產造成的欺詐已經佔到了整個逾期規模的40%-70%。

科大訊飛發布的大模型產品“訊飛星火智能客服”,以幫助金融機構提高客戶服務效率和質量,提升用戶體驗爲主旨。訊飛星火智能客服產品在意圖理解能力、專業知識應用能力、對話設計與交互能力、個性化表達能力四個層面取得了全面提升,未來還會進行迭代升級,探索與金融場景更貼近、更有價值的技術服務。

文因互聯公布了基於“文因大模型”聯通多個金融場景的解決方案。根據介紹,該解決方案覆蓋債權發行、IPO、ESG評級評價、智能投研、智能投顧、信貸評估、債券評級、合規審計、新聞寫作、工業維修等多個場景,定位是“爲金融人提供安全高效副駕駛”。

與產品相對應的是,一些行業標准也初露端倪。7月末,騰訊雲與中國信通院共同啓動行業大模型標准聯合推進計劃,雙方宣布聯合牽頭中國首個金融行業大模型標准的編制工作。

據介紹,該標准對金融行業大模型的評估方法覆蓋了投研、投顧、風控、營銷、客服、銀行、保險、證券等應用場景,並對大模型在數據合規性、可追溯性、私有化部署、風險控制等方面提出要求。

 02 應用層策略之爭

金融大模型的應用與商業化同根同源,商業化是最終目標,應用是實現商業化的必要路徑。

由於應用的方向不同,金融大模型所展現出來的能力也不同。按照模型能力輸出的方式,具體可以分爲中心化和非中心化兩種方式。

中心化模式即企業調用通用大模型或第三方垂直模型的 API 去構建業務功能;非中心化模式則是企業根據使用場景和功能,以專有數據對通用模型進行微調,形成一個或多個基於實際業務的小模型。

騰訊雲金融大模型的應用策略,是風控層面的從零到整。具體而言,針對金融機構動態化風控建模的需求,把專家經驗抽象成一系列風控策略集,進而組成風控大模型,再以風控大模型應對假人假機、假人真機、真人假機的欺詐行爲。

據報道,某金融機構的渠道和客群變化較快,基於傳統的專家聯合建模方式效率較低、成本較高,無法滿足風控系統快速迭代要求,接入騰訊雲行業大模型後,模型迭代周期從17天縮短到3天,建模效率提升60%。

這一做法與交叉信息核心技術研究院常務副院長林常樂的觀點不謀而合。林常樂提出了大模型中的相關專業領域參數與專業模型相結合的技術路线,通過將專業模型的精度參數寫入大模型,實現專業領域模型與大模型的銜接。

恆生電子與恆生聚源共同推出的智能投研平台WarrenQ-Chat,則是追求金融信息的精准度,用戶通過對話指令,輕松獲得金融行情、資訊和數據,且每一句生成的對話均支持原文溯源,確保消息出處可追溯。

科大訊飛“星火智能客服”則更注重以AI能力提升客戶交互體驗。據科大訊飛研究院副院長、金融科技事業部CTO 趙乾介紹,星火智能客服基於泛領域开放式知識問題能力、大模型和行業知識庫及外部APP對接,可以解決新知識難更新、事實類問答容易“張冠李戴”等問題;通過情景式思維鏈邏輯推理,可爲用戶推薦個性化產品,賦能營銷獲客。

百川智能創始人王小川認爲,大模型80%的價值可能蕴含在非中心化的模型和服務裏。

 03 商業化將向何處?

據極客公園報道,有消息表示,隨着監管明確,第一批合規模型放出是值得期待的。同時目前在 To B 領域的應用上,實際上已沒有官方的合規要求,這將助推大模型落地企業,也將推動工具層和應用層發展。

但面向C端,合規先行是必然趨勢。正如國家金融與發展實驗室副主任楊濤所說,當人工智能大模型在金融領域應用時,更需關注大模型的可審計性、可解釋性等難題以及參與金融活動引發的風險特徵變化、數據保護、責任分擔、合規邊界等問題,並強化數據倫理、算法倫理、主體倫理、行爲倫理等方面的治理。

中國工程院院士、復旦大學金融科技研究院院長柴洪峰認爲,目前大模型在金融垂直領域仍未挖掘出湧現效應。

一方面,由於金融數據及知識的私密性導致難以共享,無法構建一個龐大的數據集,對此可以增強產學研的聯動性,共同構建更強的金融垂直領域基座模型;另一方面由於金融數據模態更多,難以進行統一的處理建模,而如今的大模型對此種多模態的表達能力仍有待加強。

文因互聯創始人鮑捷則提出了關於商業化層面的約束問題,金融客戶並沒有無限的預算,通常只有幾十萬最多幾百萬的前期投入。實際約束往往來自於分布式訓練、數據清洗過程、提示詞優化、各種數據格式,以及爲達到更好的訓練效果如何平衡全參數訓練和提示工程的比例、降低成本,這都是需要在實際項目中解決的難題。

有從業者認爲,當前金融大模型在商業化上的探索,最終的客戶依然會落在中小金融機構上。從監管環境、市場競爭、數據安全等多個角度來看,頭部金融機構都沒有使用外部大模型的理由和意愿。

這意味着在頭部金融機構自研的過程中,中小金融機構同已有的成熟大模型合作,爭取到了一定的追趕空間,是補足數字化差距的絕佳窗口期。

同時,與中小金融機構的合作,也是考驗大模型提供方在應用層中定制化能力的絕佳战場。

正如工商銀行首席技術官呂仲濤所言,綜合考慮投入和產出性價比,中小金融機構可按需引入各類大模型的公有雲API或私有化部署服務,直接滿足賦能訴求。

 04 重新定義金融科技

從定位上看,大模型對金融行業的質效提升,是過去金融科技的延續,但效果無限拔高,無異於开啓全新紀元。

度小滿CEO朱光曾表示,類似GPT這樣大模型技術的出現,意味着所有圍繞移動互聯網、AI 1.0的競爭和優勢正在告一段落。大模型技術將重塑多個行業的工作方式和格局,其中最明顯的,也許就是金融業。換言之,大模型技術重新定義了金融科技。

也正是基於過去金融科技的應用積澱,呂仲濤認爲短期內大模型與傳統模型會共存,同時,大模型可作爲中控,將傳統模型作爲技能進行調用。從長遠來看,若大模型計算復雜度降低、可解釋性增強,其綜合性價比優勢就凸顯出來,大模型將逐步替代傳統模型。

柴洪峰認爲,金融垂直領域模型構建與金融數據的結合將成爲推動金融科技創新和發展的重要動力,人機混合智能技術將成爲推動金融領域進步的創新驅動技術。爲了克服金融大模型應用現存的諸多難題,加強產學研的合作勢在必行。

參考資料:1、"百模大战"回歸理性!騰訊雲牽頭編制中國首個金融業大模型標准,力推這一業務

2、大模型百花齊放 負責任的金融領域大模型應用備受期待

3、文因互聯鮑捷:數十萬級、百萬級投入,金融機構可擁有自己的行業大模型

4、沸騰 251 天,訪談近百位從業者,關於大模型世界的 5 個現狀

5、如何釋放大模型對金融行業的價值?

6、柴洪峰院士:大模型賦能金融科技思考與展望

       原文標題 : 逐鹿金融大模型



標題:逐鹿金融大模型

地址:https://www.utechfun.com/post/248266.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡