金融大模型，能讓普通人成爲“投資之王”嗎？

2023-06-12 18:40:04 編輯： robot

導讀最新的實驗表明，人工智能選出的股票組合漲幅約爲2%，基本與大盤持平，離所謂的“AI索羅斯”相去甚遠。自從ChatGPT問世後，人類就想到了用它來分析預測各種走勢。天氣、流行病、股價走勢，都在被給...

最新的實驗表明，人工智能選出的股票組合漲幅約爲2%，基本與大盤持平，離所謂的“AI索羅斯”相去甚遠。

自從ChatGPT問世後，人類就想到了用它來分析預測各種走勢。

天氣、流行病、股價走勢，都在被給予厚望的清單裏……

上月，一個名爲The GPT Portfolio的账號在推特迅速走紅。該账號此前宣布，將借助ChatGPT進行實盤投資。

根據他們的研究，ChatGPT 不僅能夠預測股市價格走勢，還能產生超過 500% 的回報！

而在5月26日，摩根大通也宣布正在研發名爲“IndexGPT”的金融服務工具，利用雲計算和人工智能進行證券的分析和選擇，爲客戶提供智能化和個性化的投資建議。

一時間，似乎所有人都嗅到了GPT所散發出的財富的味道……

那么，AI+金融的組合，真有那么強大么？

今天，讓我們不妨先將目光聚焦回國內，分析度小滿最近發布的金融大模型——軒轅，看看是否能在該大模型身上，找到這些問題的答案。

01 數據越大越好？

上月月底，度小滿正式發布基於BLOOM-176B研發的軒轅大模型，是一個通用+金融領域的千億級參數大模型。其數據集不但包含了各種通用內容，還包含了諸如金融研報、股票、基金、銀行、保險等方向的專業知識。

在金融場景中的任務評測中，效果相較於通用大模型大幅提升，表現出金融領域的獨特優勢。

在這裏，我們就試着從金融數據、金融新聞理解、市場輿情分析這三個方面，對軒轅大模型在金融領域的表現，進行一番剖析。

首先來看金融數據方面。

衆所周知，對於垂直領域來說，大模型所具有的專業數據越多、質量越高，其模型表現就越好。

那么在這方面，軒轅是否積累了足夠的金融數據呢？

一個不可否認的事實是：盡管百度這些年一直在盡力在金融領域布局，其麾下的度小滿涵蓋了消費金融、支付、互聯網理財、互聯網保險、互聯網證券等多個板塊，但從體量上來說，其掌握的金融數據，仍舊很難以與國內的一些龐大的金融集團，例如中投相比。

中投在國內控參股10多家金融機構，掌控萬億資產，其投資和涉及的行業包括了信息科技、金融、彈性消費品、醫療健康等領域，其中信息科技佔比最高，爲22.76%。此外，在工業、通訊服務、非彈性消費品、原材料等領域也有一定分布。

而相較之下，度小滿的金融服務，則更多地集中於互聯網金融領域。

既然沒有數據方面的絕對優勢，度小滿又怎么有信心問鼎國內首個金融大模型呢？

原因就在於，在垂直領域，專有數據的運用，其實遠比追求“絕對數據”的優勢要重要。

ARK（方舟基金）創投聯合負責人及分析師Will Summerlin在談到這點時，曾說到：“對於想抓住這次AI革命的公司來說，運用好自身的專有數據集，能讓他們快速針對自己的領域來訓練或微調模型。”

在此前百度搭建的金融生態中，出現了面向大衆的消費信貸服務品牌---有錢花、理財平台--度小滿理財，以及支付平台——度小滿錢包。

這些APP中積累的信息，構成了百度用來訓練或調整模型的大量數據，基於這些數據，百度可以形成一套自身專有的反饋循環系統，進而逐漸形成對產品的洞察力。從而使其能不斷針對客戶數據優化模型，讓模型隨着時間推移越來越好。

更重要的是，除了擁有數據之外，將數據與AI相結合的能力，也是構建金融大模型不可或缺的一步。

早在2018年，創立之初，度小滿就看到了“NLP+金融”的潛力，开始進行相應的產業布局。

而當時不僅全世界專注做NLP公司很少，成立專門的金融科技NLP團隊的更是鮮見。

經過數年的鑽研，2021年，在微軟舉辦的MS MARCO 比賽中的文檔排序Document Ranking（文檔排序）任務中，度小滿的AI-NLP團隊排名第一並刷新紀錄。

2022年，軒轅 (XuanYuan) 預訓練模型，也在中文語言理解領域最具權威性的測評基准之一CLUE分類任務中排名第一。

於是，放眼國內，在金融領域擁有龐大數據的，在NLP上卻比不過度小滿；而在NPL上有所建樹的，卻又很少能搭建出度小滿那樣專有的金融生態。

如此一來，軒轅便確立了自身在“金融大模型”這一生態位中的獨特優勢。

02 AI“索羅斯”？

除了金融數據外，軒轅大模型的另一個重要的能力，就是其對金融事件、新聞的解讀能力。

很多投資者，都希望借助大模型的能力，來分析金融時事背後的原因。

畢竟，索羅斯這樣的金融大鱷，90年代正是憑借對歐洲輿情、時局的准確判斷，做出了做空英鎊，做多馬克的決定，並一舉战勝了英格蘭銀行。

而這種閱讀並理解時事，乃至解讀市場輿情的能力，則主要是由大模型的自然語言處理能力（NLP）決定的。因爲時事解讀，輿情分析的主要任務，是對大量的文本數據進行語義分析和情感分析。

在NPL方面，軒轅大模型的一個最大特點，就是“化大爲小”，“化通爲專”。

具體來說，軒轅通過將开放領域學到的知識遷移到下遊任務，不僅改善了低資源任務數據相對不足的問題，也提高了自身的泛化能力和魯棒性。從而更好地適應不同領域和場景的閱讀和分析需求。

然而，這種用大量通用數據預訓練一個基礎模型，再用特定任務數據微調一個下遊模型的做法，以往存在兩個缺點：

一是預訓練和微調的數據可能存在不一致或不匹配的問題，導致模型難以適應新任務；

二是微調的數據可能存在不足或不平衡的問題，導致模型難以學習到有效的特徵。

對此，軒轅大模型在引入金融任務數據訓練的同時，還融合了不同粒度不同層級的交互信息，從而改進了傳統訓練模式。

具體來說，軒轅採用了多階段的訓練策略，先從通用大規模的數據逐漸遷移到小規模的特定業務以及特定任務，然後通過不同的階段逐漸訓練，直到滿足目標任務。

這樣可以緩解預訓練和微調之間的數據不一致或不匹配的問題，提高模型的遷移能力和泛化能力。

同時，在預訓練階段，軒轅還使用了多種自監督學習任務，如掩碼語言模型、語句順序預測、語句內部結構預測，這樣可以從不同角度和層次學習語言知識和語義信息，提高模型的表達能力和理解能力。

基於這樣的能力，我們也不難理解，爲何軒轅大模型曾在2022年，在中文語言理解領域的CLUE分類任務中排名第一。並且距離人類“表現”僅差3.38分。

實際上，金融行業因其與數據的高度相關性，成爲了NLP最早賦能的行業之一。

通過NLP，人們可以在證券投資中爲量化投資貢獻因子，如熱點挖掘、輿情分析、事件驅動分析，或是在大數據風控中，用Tag抽取技術爲構建用戶畫像提供技術支持。

例如事件驅動分析這一功能，在應用NLP技術前，很多金融從業人員真的是靠人盯新聞、公告，來獲取相關信息，然而，從一篇長篇累牘的新聞或公告中，找出一些風險信號或營銷機會真的是費時費力。

而NLP的應用，無疑極大地提升了金融領域的工作效率。

那么，在具備了准確識別和分析金融事件、市場輿情的能力後，金融大模型是否真的能帶衆多投資者一飛衝天，成爲AI加持下的新一批“索羅斯”呢？

03 AI+投資，神話or噱頭？

還記得开頭提到的那個借助ChatGPT進行實盤投資，並聲稱收益率超過500%的例子嗎？

截至5月底，已有2.5萬名投資者被吸引，總共約押注1000多萬美元的資金在ChatGPT選出的投資組合上。

然而，經過近兩周的實踐後，人們發現這個“AI分析師”似乎並沒有像傳說中的那么“神”。

人工智能選出的股票組合漲幅約爲2%，基本與大盤持平，且按百分比計算，該組合中後五名股票的下跌幅度超過了前五名的漲幅。

針對這種情況，有文章分析稱，這是因爲Autopilot實驗項目中的投資組合，是命令ChatGPT分析1萬條以上的新聞，並得到得分最高的前100只股票，再結合公司財報數據得到綜合打分，最終买入的前20只股票。

在失去空頭部分收益的情況下，實際的投資表現自然會與論文中的回測結果產生較大差異。

等一下，不是說AI已經可以通過NLP，准確地識別並分析金融事件、市場輿情了嗎？那爲什么在結合了1萬條以上的新聞+公司財報的情況下，“AI分析師”的表現仍然不佳呢？

可能的原因之一，就在於AI也許很客觀，但人類卻不總是如此。

在人類構築的媒體世界裏，雖然各類的網站、平台或社交媒體數不勝數，但在信息的傳播過程中，大部分普通人，卻往往會受到少數幾家頭部權威媒體的影響。

這些權威媒體、人士的傾向和態度，帶動並影響了更多的網站、平台。

於是在處理某些類型的金融產品或市場時，大模型的數據源，可能會更偏向某些特定的網站或平台，而忽略了其他來源的信息，進而產生了“數據偏見”。

此外，在處理自然語言時，大模型可能會遇到一些語義歧義的情況，如果某些詞匯有多種含義，AI在處理時可能會選擇錯誤的含義，導致信息的偏差和誤導。

這些部分，都是現階段AI無法獨自糾偏的。

不過，如果因爲AI不能讓人實現夢想中的“投資神話”，就認爲金融大模型的存在，是一種錦上添花的技術，也未免太淺薄了。

因爲在可預見的未來，傳統風控模式面臨效率低下、容易出錯、難以面對大規模數據處理等挑战。

類似度小滿在內的企業，通過大模型技術探索，讓企業可以自動化地處理大量數據，快速、精准、全面地分析和識別貸款潛在風險，進而優化風險模型，提高風險控制的准確性和效率。

此外，軒轅大模型不僅能夠解釋授信額度、計算收益率、決策參考等金融專業問題，還能夠結合資產狀況、收益目標和風險偏好，以及外部的市場動態，給出更符合用戶需求的答案和建議。