最新的實驗表明,人工智能選出的股票組合漲幅約爲2%,基本與大盤持平,離所謂的“AI索羅斯”相去甚遠。
自從ChatGPT問世後,人類就想到了用它來分析預測各種走勢。
天氣、流行病、股價走勢,都在被給予厚望的清單裏……
上月,一個名爲The GPT Portfolio的账號在推特迅速走紅。該账號此前宣布,將借助ChatGPT進行實盤投資。
根據他們的研究,ChatGPT 不僅能夠預測股市價格走勢,還能產生超過 500% 的回報!
而在5月26日,摩根大通也宣布正在研發名爲“IndexGPT”的金融服務工具,利用雲計算和人工智能進行證券的分析和選擇,爲客戶提供智能化和個性化的投資建議。
一時間,似乎所有人都嗅到了GPT所散發出的財富的味道……
那么,AI+金融的組合,真有那么強大么?
今天,讓我們不妨先將目光聚焦回國內,分析度小滿最近發布的金融大模型——軒轅,看看是否能在該大模型身上,找到這些問題的答案。
01 數據越大越好?
上月月底,度小滿正式發布基於BLOOM-176B研發的軒轅大模型,是一個通用+金融領域的千億級參數大模型。其數據集不但包含了各種通用內容,還包含了諸如金融研報、股票、基金、銀行、保險等方向的專業知識。
在金融場景中的任務評測中,效果相較於通用大模型大幅提升,表現出金融領域的獨特優勢。
在這裏,我們就試着從金融數據、金融新聞理解、市場輿情分析這三個方面,對軒轅大模型在金融領域的表現,進行一番剖析。
首先來看金融數據方面。
衆所周知,對於垂直領域來說,大模型所具有的專業數據越多、質量越高,其模型表現就越好。
那么在這方面,軒轅是否積累了足夠的金融數據呢?
一個不可否認的事實是:盡管百度這些年一直在盡力在金融領域布局,其麾下的度小滿涵蓋了消費金融、支付、互聯網理財、互聯網保險、互聯網證券等多個板塊,但從體量上來說,其掌握的金融數據,仍舊很難以與國內的一些龐大的金融集團,例如中投相比。
中投在國內控參股10多家金融機構,掌控萬億資產,其投資和涉及的行業包括了信息科技、金融、彈性消費品、醫療健康等領域,其中信息科技佔比最高,爲22.76%。此外,在工業、通訊服務、非彈性消費品、原材料等領域也有一定分布。
而相較之下,度小滿的金融服務,則更多地集中於互聯網金融領域。
既然沒有數據方面的絕對優勢,度小滿又怎么有信心問鼎國內首個金融大模型呢?
原因就在於,在垂直領域,專有數據的運用,其實遠比追求“絕對數據”的優勢要重要。
ARK(方舟基金)創投聯合負責人及分析師Will Summerlin在談到這點時,曾說到:“對於想抓住這次AI革命的公司來說,運用好自身的專有數據集,能讓他們快速針對自己的領域來訓練或微調模型。”
在此前百度搭建的金融生態中,出現了面向大衆的消費信貸服務品牌---有錢花、理財平台--度小滿理財,以及支付平台——度小滿錢包。
這些APP中積累的信息,構成了百度用來訓練或調整模型的大量數據,基於這些數據,百度可以形成一套自身專有的反饋循環系統,進而逐漸形成對產品的洞察力。從而使其能不斷針對客戶數據優化模型,讓模型隨着時間推移越來越好。
更重要的是,除了擁有數據之外,將數據與AI相結合的能力,也是構建金融大模型不可或缺的一步。
早在2018年,創立之初,度小滿就看到了“NLP+金融”的潛力,开始進行相應的產業布局。
而當時不僅全世界專注做NLP公司很少,成立專門的金融科技NLP團隊的更是鮮見。
經過數年的鑽研,2021年,在微軟舉辦的MS MARCO 比賽中的文檔排序Document Ranking(文檔排序)任務中,度小滿的AI-NLP團隊排名第一並刷新紀錄。
2022年,軒轅 (XuanYuan) 預訓練模型,也在中文語言理解領域最具權威性的測評基准之一CLUE分類任務中排名第一。
於是,放眼國內,在金融領域擁有龐大數據的,在NLP上卻比不過度小滿;而在NPL上有所建樹的,卻又很少能搭建出度小滿那樣專有的金融生態。
如此一來,軒轅便確立了自身在“金融大模型”這一生態位中的獨特優勢。
02 AI“索羅斯”?
除了金融數據外,軒轅大模型的另一個重要的能力,就是其對金融事件、新聞的解讀能力。
很多投資者,都希望借助大模型的能力,來分析金融時事背後的原因。
畢竟,索羅斯這樣的金融大鱷,90年代正是憑借對歐洲輿情、時局的准確判斷,做出了做空英鎊,做多馬克的決定,並一舉战勝了英格蘭銀行。
而這種閱讀並理解時事,乃至解讀市場輿情的能力,則主要是由大模型的自然語言處理能力(NLP)決定的。因爲時事解讀,輿情分析的主要任務,是對大量的文本數據進行語義分析和情感分析。
在NPL方面,軒轅大模型的一個最大特點,就是“化大爲小”,“化通爲專”。
具體來說,軒轅通過將开放領域學到的知識遷移到下遊任務,不僅改善了低資源任務數據相對不足的問題,也提高了自身的泛化能力和魯棒性。從而更好地適應不同領域和場景的閱讀和分析需求。
然而,這種用大量通用數據預訓練一個基礎模型,再用特定任務數據微調一個下遊模型的做法,以往存在兩個缺點:
一是預訓練和微調的數據可能存在不一致或不匹配的問題,導致模型難以適應新任務;
二是微調的數據可能存在不足或不平衡的問題,導致模型難以學習到有效的特徵。
對此,軒轅大模型在引入金融任務數據訓練的同時,還融合了不同粒度不同層級的交互信息,從而改進了傳統訓練模式。
具體來說,軒轅採用了多階段的訓練策略,先從通用大規模的數據逐漸遷移到小規模的特定業務以及特定任務,然後通過不同的階段逐漸訓練,直到滿足目標任務。
這樣可以緩解預訓練和微調之間的數據不一致或不匹配的問題,提高模型的遷移能力和泛化能力。
同時,在預訓練階段,軒轅還使用了多種自監督學習任務,如掩碼語言模型、語句順序預測、語句內部結構預測,這樣可以從不同角度和層次學習語言知識和語義信息,提高模型的表達能力和理解能力。
基於這樣的能力,我們也不難理解,爲何軒轅大模型曾在2022年,在中文語言理解領域的CLUE分類任務中排名第一。並且距離人類“表現”僅差3.38分。
實際上,金融行業因其與數據的高度相關性,成爲了NLP最早賦能的行業之一。
通過NLP,人們可以在證券投資中爲量化投資貢獻因子,如熱點挖掘、輿情分析、事件驅動分析,或是在大數據風控中,用Tag抽取技術爲構建用戶畫像提供技術支持。
例如事件驅動分析這一功能,在應用NLP技術前,很多金融從業人員真的是靠人盯新聞、公告,來獲取相關信息,然而,從一篇長篇累牘的新聞或公告中,找出一些風險信號或營銷機會真的是費時費力。
而NLP的應用,無疑極大地提升了金融領域的工作效率。
那么,在具備了准確識別和分析金融事件、市場輿情的能力後,金融大模型是否真的能帶衆多投資者一飛衝天,成爲AI加持下的新一批“索羅斯”呢?
03 AI+投資,神話or噱頭?
還記得开頭提到的那個借助ChatGPT進行實盤投資,並聲稱收益率超過500%的例子嗎?
截至5月底,已有2.5萬名投資者被吸引,總共約押注1000多萬美元的資金在ChatGPT選出的投資組合上。
然而,經過近兩周的實踐後,人們發現這個“AI分析師”似乎並沒有像傳說中的那么“神”。
人工智能選出的股票組合漲幅約爲2%,基本與大盤持平,且按百分比計算,該組合中後五名股票的下跌幅度超過了前五名的漲幅。
針對這種情況,有文章分析稱,這是因爲Autopilot實驗項目中的投資組合,是命令ChatGPT分析1萬條以上的新聞,並得到得分最高的前100只股票,再結合公司財報數據得到綜合打分,最終买入的前20只股票。
在失去空頭部分收益的情況下,實際的投資表現自然會與論文中的回測結果產生較大差異。
等一下,不是說AI已經可以通過NLP,准確地識別並分析金融事件、市場輿情了嗎?那爲什么在結合了1萬條以上的新聞+公司財報的情況下,“AI分析師”的表現仍然不佳呢?
可能的原因之一,就在於AI也許很客觀,但人類卻不總是如此。
在人類構築的媒體世界裏,雖然各類的網站、平台或社交媒體數不勝數,但在信息的傳播過程中,大部分普通人,卻往往會受到少數幾家頭部權威媒體的影響。
這些權威媒體、人士的傾向和態度,帶動並影響了更多的網站、平台。
於是在處理某些類型的金融產品或市場時,大模型的數據源,可能會更偏向某些特定的網站或平台,而忽略了其他來源的信息,進而產生了“數據偏見”。
此外,在處理自然語言時,大模型可能會遇到一些語義歧義的情況,如果某些詞匯有多種含義,AI在處理時可能會選擇錯誤的含義,導致信息的偏差和誤導。
這些部分,都是現階段AI無法獨自糾偏的。
不過,如果因爲AI不能讓人實現夢想中的“投資神話”,就認爲金融大模型的存在,是一種錦上添花的技術,也未免太淺薄了。
因爲在可預見的未來,傳統風控模式面臨效率低下、容易出錯、難以面對大規模數據處理等挑战。
類似度小滿在內的企業,通過大模型技術探索,讓企業可以自動化地處理大量數據,快速、精准、全面地分析和識別貸款潛在風險,進而優化風險模型,提高風險控制的准確性和效率。
此外,軒轅大模型不僅能夠解釋授信額度、計算收益率、決策參考等金融專業問題,還能夠結合資產狀況、收益目標和風險偏好,以及外部的市場動態,給出更符合用戶需求的答案和建議。
由此可見,在拋下了“通過AI投資暴富”的狂想後,金融大模型仍舊可以在風險防範、金融知識普及方面,讓更多群體受益。
而這種更務實的方向,才是AI+金融正確的打开方式。
原文標題 : 金融大模型,能讓普通人成爲“投資之王”嗎?
標題:金融大模型,能讓普通人成爲“投資之王”嗎?
地址:https://www.utechfun.com/post/224510.html