金融大模型,要聽見遠方的風

2024-05-11 18:40:51    編輯: robot
導讀 金融大模型,被認爲AI大模型產業化落地的第一站。 金融行業有着結構化數據充沛、應用場景豐富、數字化基礎設施良好等一系列特點,這些都是融合AI技術的利好因素。所以當AI大模型开始爆火之後,各界會不約而...

金融大模型,被認爲AI大模型產業化落地的第一站。

金融行業有着結構化數據充沛、應用場景豐富、數字化基礎設施良好等一系列特點,這些都是融合AI技術的利好因素。所以當AI大模型开始爆火之後,各界會不約而同認爲金融是AI大模型的天然良港。

從2023年至今,中國金融大模型市場的發展也確實印證了這一判斷。根據相關數據,目前中國市場已經有近20個金融大模型落地應用,頭部金融機構要么已經應用AI大模型,要么展示了對AI大模型的研發與應用計劃。

圖片

要知道,在降本增效的大背景下,金融機構目前還需要兼顧移動金融、數字系統自主替代等多項數字化投資目標,能夠分給AI大模型的資源並不豐富,而AI帶給金融機構的投資回報比還非常有限。高效上馬大模型,對金融行業來說真的值得嗎?

記得2023年我在參加一個金融科技峰會時,與一位銀行代表進行溝通。他提出金融機構做AI大模型,最根本的動力是擔憂。在移動互聯網時代來臨前,全球金融行業普遍低估了新技術帶來的衝擊力。隨後被Apple Pay、支付寶、微信等移動互聯網平台分潤了時代紅利。不讓類似境況重演,是驅動金融機構加碼AI大模型的底層動機。

如果是這樣的話,金融行業僅僅快步走向大模型並不夠,同時還需要聽見遠方的風,要能夠從長期目標來回溯中短期的行動規劃。

今天,我們就從這個觀點出發,聊聊快速用上了大模型之後的金融行業,接下來走向何方?

金融大模型,從高速覆蓋1.0,走向價值最優2.0

從全球到中國市場,生成式AI帶來的大模型之變,都在一年多的時間裏掀起了金融行業的科技革新浪潮。

在國際上,OpenAI將金融行業視爲GPT技術落地的首站,比如其與摩根士丹利合作,推出了基於 GPT-4的投資顧問機器人。

而在中國金融行業,AI大模型可謂以前所未有的態勢得到了高速覆蓋。在短短一年多的時間裏,處於頭部地位的銀行、券商以及保險機構紛紛完成了金融大模型的落地應用。

比如說,工商銀行就宣布建成了同業首個全棧自主可控的千億級AI大模型技術體系,並在多個金融業務領域實現了創新應用。例如在網點運營上,推出了基於大模型的網點員工智能助手。農業銀行AI推出了類ChatGPT的AI大模型應用ChatABC,並在科技問答場景進行了內部試點。郵儲銀行通過接入百度“文心一言”,從而在智能風控、智能運營、智能投研、智能營銷等場景進行大語言模型應用。

圖片

在民營銀行層面,網商銀行將大模型技術應用於產業金融層面,從而識別小微企業的信用畫像。在保險行業,衆安保險搭建了“衆有靈犀”系統,將大模型帶入智能客服、到期提醒、智能運營等業務場景中。

而從技術與解決方案供應商的層面看,目前中國市場已經呈現出多樣化的金融大模型技術供應渠道。騰訊雲、螞蟻金服都推出了金融大模型解決方案。面向金融行業既需要大模型落地,同時也需要基礎設施更新的需求。華爲在2023年依托盤古大模型,推出了金融級PaaS解決方案,發布了包括AI for Data、AI for Business、AI for IT三大類10個場景的金融大模型方案。

而在开源大模型層面,度小滿开源了軒轅大模型,其在1760億參數的Bloom大模型基礎上訓練而來,已經應用在度小滿各個業務場景,覆蓋了從營銷、客服、風控、辦公到研發等場景,並在一系列大模型評測中取得了領先地位。

可以看到,金融大模型已經快速走過了以高速覆蓋爲特徵的1.0時代。在第一階段,金融大模型相關技術與解決方案快速出爐,頭部金融機構競相試用,爲中國金融大模型的發展打下了良好的基礎。

金融大模型第一階段的發現成果顯而易見,比如說,技術發展速度快,用戶積極性高。同時金融大模型的業態覆蓋非常完整,從銀行到保險、證券等領域兼顧,此外相關的技術能力供應鏈已經完善。閉源模型與开源模型兼顧,多種部署方式完備,與金融大模型相配套的軟硬件基礎設施已經較爲齊全。

但在接下來,金融大模型需要從具有探索性質的1.0階段,走向必須要求回報率,要體現長期發展價值的2.0階段。

這一階段,金融大模型需要面臨的挑战更加復雜,同時战略方法論的問題也將浮出水面。

已經暴露出的挑战

統觀金融大模型的落地進程,會發現其中表現出的優劣勢邏輯,與此前AI技術落地金融業如出一轍。第一階段,行業會直觀感到AI很好用。但接下來,AI能否帶來充足的投資回報,能否深入業務核心,才是更大的挑战。

目前,金融大模型也遇到了類似問題。首當其衝,大模型所帶來的智能幻覺、數據污染等問題,與金融行業對專業性、安全性的極高需求是難以匹配的。

圖片

其次,由於金融行業極高的涉密等級與安全合規要求,往往需要私有化進行大模型部署,同時禁止模型學習大量數據,禁止數據過分流動。這又催生了兩個問題,一個是私有化部署給金融機構帶來了極大的研發與運維成本壓力。另一個是高安全等級與限制數據使用,帶來了金融大模型效果不佳等問題。

對於金融機構來說,不僅是研發、訓練大模型的成本過高,將模型進行場景化部署的成本壓力也很大。由於目前金融大模型還處在探索階段,難以帶來實際的商業回饋,因此其部署往往是在機構內部,或者邊緣業務中。這就導致部署成本不斷放大,但商業化價值卻遲遲無法釋放。

最後,也正是處於金融行業高安全,與大模型技術不夠成熟二者間的差距。金融大模型普遍無法在金融核心業務中進行部署。比如大模型加持的智能客服,不僅無法代替客服人員,還可能出現需要頻繁喚醒人工客服,且需要客服重新理解用戶需求的現象。而在風控等產業應用側,大模型雖然表現出了巨大的潛力,但還無法真正處理較爲復雜的風險異常。

這種情況下,金融大模型很可能在運行一段時間,熱度相對褪去之後,又和許多金融科技一樣流於邊緣化。

如何才能突破技術與產業之間的長期壁壘?這可能需要金融大模型聽到一些來自遠方的風。

從未來,回看現在

布萊特·金在著名的《銀行4.0》中,第一章就在討論第一性原理的回歸。即我們需要回歸問題的本源,回歸設計的本質。放在金融場景,就是我們首先需要理解銀行被設計出來是爲了什么,繼而在討論銀行應該如何發展。

想要打破金融大模型可能面對的壁壘,我們也必須有這樣一個意識:去思考,去判斷,甚至去假設未來大模型究竟能給金融帶來什么,再從未來倒推現在。

哪怕這個未來相對遙遠,至少遠方的風不會帶我們走進死胡同。

那么,AI大模型到底能爲金融帶來什么?

這個問題可以分爲兩個維度去理解,一個是技術維度,一個是應用維度。

從技術上看,大語言模型的技術升級路徑已經相對確定,業界對其技術發展範式以及工程化實踐已經有了明確的共識。

比如說,最近我們讀了由度小滿金融技術委員會執行主席、數據智能應用部總經理楊青所撰寫的《大語言模型:原理與工程實踐》。書中除了明確提出了大語言模型的多項關鍵技術之外,還指出了其在湧現能力、推理能力上的特點,以及廣受關注的大語言模型縮放定律。隨着模型訓推能力的提升,大語言模型將持續出現智能湧現效果。這一技術錨點是金融行業所追尋的長期價值,也是度小滿等金融科技供應商探索大語言模型的價值關切。

而從應用維度看,目前金融大模型的應用場景繁多,但歸根結底可以總結成三個方面

  1. 面向大衆用戶的智能客服-智能顧問。
  2. 面向產業用戶的智能信貸識別-信用體系構建。
  3. 面向金融機構內部的職員能力提升。

圖片

這三種能力的極致化,就是金融大模型可能帶來的長期價值。比如在未來,以大語言模型驅動的智能客服,可能會變成智能顧問、一對一的金融服務專家。不僅可以完成業務對接,信息告知等基礎功能,還可以結合用戶需求給出定制化的金融方案,實現金融訂制能力從大額用戶、企業用戶向普惠用戶的轉變。

將技術維度與應用維度進行綜合,我們可以將金融大模型的未來錨定在三個方面:

1.企業與個人信用服務的智能泛在化。

2.金融客服的少人化甚至無人化。

3.金融機構綜合智能能力的極致化。

如果說,移動金融是把銀行、券商直接开到了用戶手裏,是讓金融距離用戶更近,那么AI大模型金融,則是讓用戶走得更遠,讓用戶的一切訴求與資產都可以與金融服務建立聯接。

用遠方的風,丈量現在的路

一段時間以來,金融大模型領域存在着務虛與務實的爭論。

所謂務虛,是指金融機構應該更關注算法本身,關注模型性能,先上馬大模型,拿着大模型的錘子找金融業務的釘子。

而務實則是要求從金融行業的應用場景出發,優先考慮金融應用智能化的安全合規與成本可控,在此基礎上再去適配裁剪大模型的能力,讓大模型爲金融服務。

某種程度上來說,二者都有正確的因素,但或許也都可以補充新的思路。因爲二者都更加關注短期抉擇,忽略了金融大模型的出發點是行業的跨時代升級,是尋求像移動金融一樣,甚至更加深刻的長期變革。

金融大模型需要補充的思路,就是務實務虛之外,需要務未來,需要從最終可能實現的理想化目標,來一步步推導現在的工作。讓遠方的風,吹動現下的腳步。

從這個角度看,金融機構就需要兼顧上馬大模型的效率,同時兼顧未來可能隨時出現的更多AI技術創新。讓自身的數字化架構與軟硬件基礎設施,適配隨時會到來的AI技術迭代。具體來看,“務未來”的金融大模型,可能包含以下三層行動:

圖片

1.打好金融大模型基座。其中包括自身的研發體系,也包括與技術供應商之間开放有效的合作關系,避免因過度保守而遭遇技術擱淺。

2.兼顧金融大模型的工程力與想象力。面向大語言模型的長期發展,金融行業不能局限於有大模型,更需要錘煉對大模型的工程化掌控力,隨時可以將大模型錘煉成符合自身需求的狀態,同時積極开啓創造性的大模型探索。既在內部酝釀變革,也不放過外部機遇。

3.構建長期且清晰的智能化目標。對於金融大模型,我們要正視其短期的局限性,以及長期的可能性。在战略上回歸大模型最本身的第一優先性原理,然後以此爲目標倒推每一步的進展。

當大模型出現在金融業面前時,我們的第一感受都是驚喜與遐思。但在實際應用大模型時,往往會過於聚焦眼前,比如是否使用了大模型,覆蓋的業務場景,以及帶來的投資回報率。這時,浮現出的挑战以及不那么清晰的價值往往會滋生矛盾,讓金融機構進退維谷。只要讓遠方的風吹進來,讓金融智能化的長期主義映照現在,絕大部分問題都會找到解法。

P.s.本文寫作過程中,《大語言模型:原理與工程實踐》帶來了許多啓發與幫助,特此感謝。

圖片

書中詳細介紹了大語言模型的工作原理,如何評估大語言模型的性能,以及大語言模型在金融場景的實際操作方案。

相信無論是計算機與AI領域的產品、技術、研發人員,還是金融行業的從業者,都能夠從中獲益。

       原文標題 : 金融大模型,要聽見遠方的風



標題:金融大模型,要聽見遠方的風

地址:https://www.utechfun.com/post/369584.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡