導語:金融業數智化步入“深水區”。
出品丨數科社
作者丨林木
就在由ChatGPT引爆的國內“千模大战”激战正酣之際,與AIGC有着諸多契合場景的金融領域踏上了一條探尋行業大模型的變革之路。
今年3月,彭博社針對金融業推出大型語言模型BloombergGPT,立即引起國內市場對金融垂直領域大模型應用的廣泛關注。繼各互聯網巨頭躬身入局後,金融科技賽道的頭部玩家們也开始馬不停蹄的探路大語言模型。
5月,星環科技推出第一款面向金融量化領域的生成式大語言模型“無涯Infinity”,度小滿开源國內首個千億參數金融大模型“軒轅”;6月,恆生電子發布金融行業大模型LightGPT,將於9月底开放試用接口;最近,馬上消費的自研金融大模型箭在弦上即將發布……
在近百款大模型產品的激烈交鋒下,通用大模型的求解能力日益趨近同質化,也讓大模型在特定行業的落地奔跑成爲新賽點。
那么,“金融大模型”這條路究竟如何走通?又將給金融行業帶來哪些驚喜和挑战?
01丨探路“金融大模型”
月初剛剛在上海落幕的WAIC上,“大模型”無疑成爲今年廠商、與會者屢屢提及的熱詞。大會期間,來自各家廠商的30多個基礎大模型、垂直大模型集中亮相,讓眼下這場“千模大战”的硝煙味又重了一分。
在讓人眼花繚亂的通用大模型之中,垂直於行業的大模型可謂是今年大會的亮點之一。馬上消費CTO蔣寧在現場接受媒體採訪時表示,大語言模型技術出世後,對金融行業的人工智能技術應用無異於“強心劑”。
在他看來,金融行業有着數據密集型、技術密集型的天然屬性,一直在探索數據資產化,挖掘數據價值,同時又面臨着如銀行线下網點的價值傳遞效率問題、用戶體驗問題,需要機構持續創新。
基於這些行業特點,也注定了大語言模型技術將會爲其帶來新的賦能。3月底,BloombergGPT的發布標志着ChatGPT引爆的AI熱潮已一路蔓延到了金融圈。
據彭博社發布的報告指出,這一專門訓練用於金融領域的大語言模型(LLM),訓練中在金融任務上的表現遠超過現有模型,且在通用場景上的表現與現有模型也能一較高下。
這將意味着,LLM正在邁向結合具體行業和特定場景進行垂直落地的新階段,不僅是其實現商業化躍遷的關鍵,更是整個產業大爆發的重要一步,這也引來國內金融科技廠商迅速跟進。
“對比於通用大模型的能力而言,金融行業非常需要垂直行業大模型。”在不久前召开的2023全球數字經濟大會上,度小滿CTO許冬亮也給出了自己的看法。
他認爲,囿於金融行業在數據安全隱私、風控、精度以及實時性等方面要求較高,使得通用大模型在金融能力上缺乏必要的訓練數據,從而對金融常識、生成的可控性和准確性都達不到這個行業的最低要求,因此需要針對金融機構定制的行業大模型去發揮效力。
作爲搶先一步試水的頭部玩家之一,度小滿在5月下旬推出了國內首個垂直金融行業的开源大模型“軒轅”。該模型基於1760億參數的Bloom(決定輸入數據如何轉換爲輸出內容的變量)大模型基礎訓練而來,相較於通用大模型,在金融名詞理解、金融市場評論、金融數據分析和金融新聞理解等金融場景任務上的表現可圈可點。
下水的顯然不止度小滿一家。6月28日,恆生電子金融行業大模型LightGPT也首次對外亮相。恆生電子董事長劉曙峰表示,大模型是信息技術的最新突破,刷新了人們對機器智能的認知,同時也在刷新行業應用傳統AI模型的模式。
在“千模大战”背景下,隨着各路金融科技企業在大模型的不斷試水,金融業數智化的發展也悄然走向了一個從量變到質變的新階段。
02丨生成式AI浪潮能力湧現
大模型時代,算力、算法、數據構成了新範式的“三駕馬車”,其中,數據更可視爲決定大模型質量和商業化落地的核心要素。作爲一個業務流程規範、數據和知識沉澱完備的行業,金融業天然具有應用大模型的基礎優勢。
回顧過去十年金融業的發展浪潮,是一場涉及到整個金融產業的信息化和數字化革命,爲人工智能的滲透融入奠定了基礎。近年來,在智能營銷、智能風控、智能投研、智能客服等領域,基於機器學習驅動的建模能力都是金融機構數智化轉型翻湧的浪花。
當下以生成式AI爲代表的第二波人工智能浪潮席卷至金融業,大模型所積聚的“三駕馬車”也已從量變走向質變。
在近日恆生聚源主辦的“大模型在金融行業的應用與展望”研討會上,恆生電子高級副總裁、恆生聚源董事長王鋒表示:“傳統的AI模型,參數量少,通過大量的數據標注、大規模的模板配置來實現。換一個場景就要再重新來過一遍,泛化性不足,被詬病爲有多少人工,才有多少智能。而大模型基於GPT——生成式預訓練tranformer技術路线,通過預訓練、微調、獎勵模型、強化學習四個主要步驟和千億級別參數規模,做到了令人驚豔的效果,也就是我們所說的能力湧現。”
這種能力湧現如今正賦能在金融雲產品的方方面面。
如在AI开發層面,大模型展現出強大的代碼自動化生成能力,顛覆了傳統的“手工作坊式”模型,極大提升了機器學習的开發效率和生產模式;在智能交互方面,大模型的語音識別率不僅精准,還能憑借着深度語義理解與生成能力,快速解答客戶復雜且專業性的問題;在分析決策方面,有着強大信息挖掘能力的大模型,能在風險決策、信用評估、反欺詐等場景,觸及小模型無法覆蓋到的區域。
申萬宏源證券研究所所長助理劉洋認爲,在算力、算法、數據“三駕馬車”的推動下,工程化能力變得尤爲重要,特別是在券商、基金這樣的垂類大模型應用場景下,率先爲客戶提供服務的廠商將搶佔先機。
因此,金融大模型的落地應用也成了市場當下所聚焦的關鍵一步。
03丨落地商業化尚需時日
盡管業內普遍認爲,大模型將是开啓金融領域“iPhone時刻”的按鈕,但擺在眼前的事實是,現下的“金融大模型”主要停留在工具層和應用層,更類似於業務流程優化助手,在核心金融業務場景的落地之路任重而道遠。
作爲一個受到強監管的行業,金融業首先對於技術應用的安全性、穩定性、可控性等要求遠比其他行業更爲嚴格。尤其是在考慮到數據的安全與合規問題,意味着前期的數據採集和“清洗”等工作,廠商可能需要花費更多的時間和精力。
在馬上消費CTO蔣寧看來,挑战主要現有大模型難以在金融特定領域實現落地的挑战主要來自四個方面:
一是當前的大模型在面對動態且不可預期變化的金融各項業務時,還並不能做到每一份決策都穩定、精確;二是金融行業往往希望爲用戶提供個性化的服務體驗,但這需要個人隱私數據和大模型相融合,涉及到合規和安全問題;三是金融行業一直存在的“數據孤島”問題,大模型要求構建增強學習的網絡化平台,並持續貢獻數據和反饋,但目前背後市場的數據生態是割裂的,仍然需要持續性的探索;四是金融行業大模型應用對底層設備、基礎架構等軟硬件設施提出更高的要求。
對於上述挑战,他認爲可從強化學習和持續學習技術、魯棒性決策、組合式AI系統技術等三個大模型領域的關鍵技術入手。
他進一步解釋道,強化和持續學習會讓系統越用越聰明,這就在於大模型幕後自適應的生態能力建設,魯棒性決策則是實現關鍵決策的持續穩定和合規可信的核心環節,組合式AI系統技術可以有效結合各種垂直領域的判別式模型的可用性和專業性,助其真正發揮大模型的泛化能力優勢。
基於上述認知,馬上消費在探路金融大模型方面制定了“三橫三豎”战略。據蔣寧透露,目前公司已开發了智能生成報表的工具產品,在智能客服場景上也有所涉獵,並即將發布自研的金融大模型。
最後關於行業最受掣肘的數據質量和合規問題,奇富科技首席算法科學家費浩峻此前在接受《中國經營報》採訪時表示,對於數據質量問題,可以從數字化改造的源頭進行標准化建設,並且設置有嚴格一致性的評估指標和方法。而在合規方面,商用級需要重點解決的問題是輕量級和易用性。
顯然,對於剛剛邁入數智化“深水區”的金融業而言,尚需要一個適應到不斷完善的過程,這也需要身處水中的廠商們擁抱合作互通,共同迎接大模型時代的到來。
原文標題 : 大模型的浪頭卷到了金融業
標題:大模型的浪頭卷到了金融業
地址:https://www.utechfun.com/post/243595.html