寫研報水平超過ChatGPT,國產大模型究竟在“寫”啥?

2024-01-31 18:40:16    編輯: robot
導讀 按照科技行業普遍觀點,某個技術超越科技奇點後就會產生科技大爆炸,圍繞該技術的各類應用層出不窮,繼而激活一輪新科技革命。顯而易見的是,通過GPT,AI實際上已在2023年跨越了技術奇點。2024年开始...

按照科技行業普遍觀點,某個技術超越科技奇點後就會產生科技大爆炸,圍繞該技術的各類應用層出不窮,繼而激活一輪新科技革命。顯而易見的是,通過GPT,AI實際上已在2023年跨越了技術奇點。2024年开始,AI正在進入“大航海時代”作者/李長懷編輯/沐凌

國產大模型廠商,正在一些局部能力上成功趕超ChatGPT。近日,弗若斯特沙利文(Frost & Sullivan)聯合頭豹研究院發布《2023年中國大模型行研能力評測報告》,商湯商量、文心一言3.5、訊飛星火等多款國產大模型均取得了接近甚至超過GPT3.5的得分。

數字行研作爲一個小規模、不成熟的行業,對擠進榜單前列的幾家廠商整體發展的影響似乎不大。不過,作爲中國廠商全面布局的AIGC衆多細分市場之一,這些廠商接近甚至超過ChatGPT3.5的能力表現,卻是對其大模型卓越競爭能力的有力驗證;也是他們通過各個細分領域“聚沙成塔”效應,實現業務穩健發展的一個支點。尤其是在AI大航海時代,AI不僅成爲各行各業轉型升級的核心動力,也必然帶來全球科技行業格局和秩序的重構。近日微軟市值反超蘋果,即是前兆。透過榜單縱觀整個AIGC市場,商湯、百度、科大訊飛等中國大模型廠商,實際上已具備參與國際競爭,並競逐未來AI時代全球科技領域少數幾個領導者的能力。

01

新賽道,“中國隊”集體反超

自ChatGPT爆火以來,生成式 AI的顛覆性已毋庸置疑。沒有人再追問何爲生成式 AI,而是希望了解它究竟能給自己帶來什么價值。而金融行業應用AI技術撰寫研報早已有之。早在2018年,一家名爲Kensho的人工智能公司,就开發出一款Warren分析軟件(取自沃倫·巴菲特),只需幾分鐘即可完成各類信息搜索和投研分析,爲用戶提供投資建議。相比之下,完全依靠人工操作的資產分析師團隊,要完成這一過程,往往需要長達一周時間。這種顛覆性的投研分析工具,不僅讓Kensho贏得了華爾街“人神共憤”的名聲,更讓這家初創公司獲得標普5.5億美元的收購大單,成爲當時人工智能領域最大的一筆收購交易。

而再往前看,Kensho的早期投資人中,更是不乏高盛、大摩、小摩、花旗、布雷耶、谷歌風投、恩頤投資等國際頂尖投資機構。可見,對於數字投研的產業價值,國際投資界早已“用腳投票”。之所以一直不溫不火,大概還要歸因於技術。據沙利文指出,行業研究的行業特殊性、復雜性、嚴謹性,對內容生成和創作能力提出了多維度的高要求。而顯然,以ChatGPT爲代表的語言大模型的突破,成功解決了這一問題。業界至今仍記得,2023年2月,財通證券發布的一篇由ChatGPT撰寫的醫美研報,剛一發布就迅速在金融圈刷屏,有券商分析師直呼:“肯定會替代人工。”

衆所周知,內容生成和創作能力是目前大模型最火熱的應用場景。Gartner 預測,到2025年,企業30%的營銷信息將會由大模型協助生成。數字投研恰好趕上了這一輪數字變革,從默默無聞一轉身成爲爆火的黃金賽道。這次由沙利文例舉的12款大模型背後的研發廠商,堪稱大模型“中國隊”的排頭兵,代表了中國大模型廠商的整體技術能力。譬如商湯科技,早在大模型熱興起之前,其已成爲全球領先的AI軟件公司。

根據沙利文報告,在這次榜單中,商湯語言大模型“日日新·商量”(簡稱:商湯商量)以總分7.73斬獲總榜第一,並在報告撰寫能力(八大模塊)、模型基礎能力(行研基礎能力)兩個子榜位居第一,成績明顯高於GPT3.5(7.29分)。除商湯之外,百度旗下的文心一言3.5,也獲得了7.48的總分,實現對GPT3.5的反超。科大訊飛旗下的訊飛星火總分7.25,緊隨其後,並在報告撰寫能力子榜上獲得8.10的得分,遠高於GPT3.5的7.58。無論是商湯、百度的整體能力超越,還是科大訊飛的單項能力超越,都向我們傳遞出這樣一個事實:中國大模型廠商,已經具備在數字行研這一新興賽道參與國際競爭並佔得優勢的能力。 而作爲內容生成領域的一個高門檻行業,這也意味着“中國隊”在AIGC的其他賽道,同樣可以佔得一席之地。

02

構築AI之塔的又一粒金沙

“每個行業都可以重做一遍”,是這波AIGC熱潮中被重復最多的一句話。這句話其實包含兩個方面,一是用大模型賦能改造各行各業,實現性能升級、服務升級,大幅提升產業效率,在此過程中實現大模型的商業變現;另一方面,則是依托大模型超強的智能化能力,創造新的智能化產品、服務,开拓新的賽道。數字行研恰恰就是後者的一個典型例證。

可以說,如果沒有大模型這樣強大的數字能力支撐,Kensho式的小打小鬧,也許很難形成如今刷屏金融圈的金融科技新賽道。類似的案例俯拾即是。去年年中,小冰公司开始推出網紅明星克隆人,數字人聊天平台Character.AI的移動端首周下載量甚至超過ChatGPT,其背後正是大模型以其突破性的內容生成能力,實現了數字人的個性化。用《第一財經》的話說:“AI已开始爲數字人注入靈魂。”

至於前者,微軟、阿裏、百度等國內外科技巨頭,使用大模型工具對其自身及客戶產品、平台功能的陸續改造,早已不是什么新鮮事。從行業發展來說,兩者的“雙路並進”,帶來了大模型相關行業快速增長的強勁動力。而從企業來看,這也要求他們不能拘於一隅,限制了自身的發展,而是要不斷地拓展大模型應用領域,在現有的各行各業率先實現業務落地,站穩腳跟的同時,不斷探索新的市場,才能真正實現自身業務的穩健、長期增長。

好在,從政策層到企業層,都已意識到行業落地的重要性,並正在積極推進。2023年7月發布的首部大模型監管法規《生成式人工智能服務管理暫行辦法》,首先即明確了鼓勵生成式人工智能技術在各行業、各領域的創新應用,探索優化應用場景,構建應用生態體系。今年兩會期間,大模型的落地應用也成爲代表討論的高頻詞。企業方面,就本次報告中幾家領先廠商來看,在數字行研之外的衆多領域,他們都已實現成功落地。據商湯介紹,截至去年11月底,商湯的語言大模型商量在金融、手機、醫療、汽車、地產、能源、傳媒、工業制造等衆多垂直行業,已經與超過500家客戶建立了深度合作。如果拓展到商湯公司在2023年4月發布的全系列生成式AI產品——商量、秒畫、如影、瓊宇、格物,商湯大模型產品的落地應用,正展現出強勁的發展潛能。

根據商湯2023年半年報,公司生成式AI相關收入錄得了670.4%的同比增長,對集團業務的貢獻從2022年的10.4%迅速提升至20.3%,AIGC轉型正呈現加速態勢。國聯證券研報認爲,AI大模型已开啓商湯第二增長曲线。從商湯的AIGC轉型來看,大模型廠商的業務增長模式,恰如《法華經》中“聚沙爲佛塔”的“童子戲”。對於商湯、百度、科大訊飛等一衆中國大模型廠商來說,在產業發展初期,“壘石爲屋”式的發展往往會面臨找不到石塊的窘境,因而每一粒細沙都顯得彌足珍貴。 可喜的是,面對潛力十足的數字行研賽道,他們沒有錯過這粒金沙。

03

“大航海時代”的“小日記”

按照科技行業普遍觀點,某個技術超越科技奇點後就會產生科技大爆炸,圍繞該技術的各類應用層出不窮,繼而激活一輪新科技革命。顯而易見的是,通過GPT,AI實際上已在2023年跨越了技術奇點。2024年开始,AI正在進入“大航海時代”。

500年前的那次大航海,不僅帶來了“日不落”帝國在全世界範圍的崛起,也酝釀了當今世界唯一超級大國的雛形,世界格局發生了翻天覆地的變化。對於AI行業這場新的“大航海”來說,其在全球科技領域深遠影響也同樣顯而易見。因此,“每個行業都可以重做一遍”,對如今的大模型廠商來說,既是機遇,也是挑战。產業滲透的進展,在各個細分領域的份額,直接影響到大模型廠商在未來科技競爭中的沉浮。1月11日,微軟股價上漲,市值再次超過蘋果,成爲新年以來最受關注的事件之一,仿佛就是科技行業的一個隱喻。

市場似乎認定了在大模型研發應用上走在了前面的微軟,比遲遲不見動靜的蘋果公司,更有可能抓住未來科技領域最有價值的機遇,成爲新的“日不落”和“美利堅”。幸而,中國的大模型廠商們,也已經造好了他們的海船。以本次報告中得分高居榜首的商湯爲例,其在整個AIGC領域已構建起從算力基礎設施到模型到應用的全棧布局,公司在“大模型+大算力”的战略下,通過AI大裝置SenseCore打造出了具備自然語言處理、內容生成、自動化數據標注、自定義模型訓練等多種大模型及能力的“日日新SenseNova”大模型體系,催生了AIGC“新的研究範式”,即基於一個強大的多模態基模型,通過強化學習和人類反饋,不斷解鎖基模型新的能力,從而更高效地解決海量的开放式任務。在“日日新”大模型體系下,商湯創造出了一系列生成式AI模型及應用。

尤其值得注意的是,在AI算力需求指數式增長帶來的算力短缺背景下,商湯對智能計算基礎設施SenseCore大裝置進行持續升級,算力規模達到6ExaFLOPS,爲這艘中國大模型“海船”,提供了充足、可靠的動力。環顧全球大模型廠商,“迪亞士”們率先啓航,但也尚未走遠;“達伽馬”們未來或許不一定能發現新大陸,但开闢出通往東方的新航线,也將在“日不落”帝國的崛起中發揮重要作用;“麥哲倫、哥倫布”出發稍晚,但等在他們前方的,是最受矚目的美麗新世界。一切都還只是剛剛开始,桂冠也不止一個,唯一的問題是:路在何方?

在如今大模型應用爆發的初期,應用領域挖掘不徹底、商業模式不完善是擺在大模型廠商面前的共同難題。要尋得這些難題的破解之法,只能在更多的應用領域進行長期深入的廣泛探索,從中總結經驗,發現規律。數字行研本身只是大模型無數應用領域中微不足道的一個,但它對各家廠商們的價值,或許正在於此。 讓我們再次回想500年前,當哥倫布來到美洲時,他仍在自己的航海日記中,書寫着在他看來稀松平常的見聞。但直到今天,我們都知道,這位空前偉大的航海家,不經意間已經記下了歐洲人登陸新大陸的偉大時刻。在數字行研領域“集體”反超GPT3.5的成果,或許也可以看作中國大模型廠商們,記下的一篇稀松平常的“航海日記”。我們期望,終有一天,在大模型發展的漫漫航程中,中國廠商們,也將迎來自己的“登陸時刻”。

       原文標題 : 寫研報水平超過ChatGPT,國產大模型究竟在“寫”啥?



標題:寫研報水平超過ChatGPT,國產大模型究竟在“寫”啥?

地址:https://www.utechfun.com/post/326361.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡