寫研報水平超過ChatGPT，國產大模型究竟在“寫”啥？

2024-01-31 18:40:16 編輯： robot

導讀按照科技行業普遍觀點，某個技術超越科技奇點後就會產生科技大爆炸，圍繞該技術的各類應用層出不窮，繼而激活一輪新科技革命。顯而易見的是，通過GPT，AI實際上已在2023年跨越了技術奇點。2024年开始...

按照科技行業普遍觀點，某個技術超越科技奇點後就會產生科技大爆炸，圍繞該技術的各類應用層出不窮，繼而激活一輪新科技革命。顯而易見的是，通過GPT，AI實際上已在2023年跨越了技術奇點。2024年开始，AI正在進入“大航海時代”。作者/李長懷編輯/沐凌

國產大模型廠商，正在一些局部能力上成功趕超ChatGPT。近日，弗若斯特沙利文（Frost & Sullivan）聯合頭豹研究院發布《2023年中國大模型行研能力評測報告》，商湯商量、文心一言3.5、訊飛星火等多款國產大模型均取得了接近甚至超過GPT3.5的得分。

數字行研作爲一個小規模、不成熟的行業，對擠進榜單前列的幾家廠商整體發展的影響似乎不大。不過，作爲中國廠商全面布局的AIGC衆多細分市場之一，這些廠商接近甚至超過ChatGPT3.5的能力表現，卻是對其大模型卓越競爭能力的有力驗證；也是他們通過各個細分領域“聚沙成塔”效應，實現業務穩健發展的一個支點。尤其是在AI大航海時代，AI不僅成爲各行各業轉型升級的核心動力，也必然帶來全球科技行業格局和秩序的重構。近日微軟市值反超蘋果，即是前兆。透過榜單縱觀整個AIGC市場，商湯、百度、科大訊飛等中國大模型廠商，實際上已具備參與國際競爭，並競逐未來AI時代全球科技領域少數幾個領導者的能力。

新賽道，“中國隊”集體反超

自ChatGPT爆火以來，生成式 AI的顛覆性已毋庸置疑。沒有人再追問何爲生成式 AI，而是希望了解它究竟能給自己帶來什么價值。而金融行業應用AI技術撰寫研報早已有之。早在2018年，一家名爲Kensho的人工智能公司，就开發出一款Warren分析軟件（取自沃倫·巴菲特），只需幾分鐘即可完成各類信息搜索和投研分析，爲用戶提供投資建議。相比之下，完全依靠人工操作的資產分析師團隊，要完成這一過程，往往需要長達一周時間。這種顛覆性的投研分析工具，不僅讓Kensho贏得了華爾街“人神共憤”的名聲，更讓這家初創公司獲得標普5.5億美元的收購大單，成爲當時人工智能領域最大的一筆收購交易。

而再往前看，Kensho的早期投資人中，更是不乏高盛、大摩、小摩、花旗、布雷耶、谷歌風投、恩頤投資等國際頂尖投資機構。可見，對於數字投研的產業價值，國際投資界早已“用腳投票”。之所以一直不溫不火，大概還要歸因於技術。據沙利文指出，行業研究的行業特殊性、復雜性、嚴謹性，對內容生成和創作能力提出了多維度的高要求。而顯然，以ChatGPT爲代表的語言大模型的突破，成功解決了這一問題。業界至今仍記得，2023年2月，財通證券發布的一篇由ChatGPT撰寫的醫美研報，剛一發布就迅速在金融圈刷屏，有券商分析師直呼：“肯定會替代人工。”

衆所周知，內容生成和創作能力是目前大模型最火熱的應用場景。Gartner 預測，到2025年，企業30%的營銷信息將會由大模型協助生成。數字投研恰好趕上了這一輪數字變革，從默默無聞一轉身成爲爆火的黃金賽道。這次由沙利文例舉的12款大模型背後的研發廠商，堪稱大模型“中國隊”的排頭兵，代表了中國大模型廠商的整體技術能力。譬如商湯科技，早在大模型熱興起之前，其已成爲全球領先的AI軟件公司。

根據沙利文報告，在這次榜單中，商湯語言大模型“日日新·商量”（簡稱：商湯商量）以總分7.73斬獲總榜第一，並在報告撰寫能力（八大模塊）、模型基礎能力（行研基礎能力）兩個子榜位居第一，成績明顯高於GPT3.5（7.29分）。除商湯之外，百度旗下的文心一言3.5，也獲得了7.48的總分，實現對GPT3.5的反超。科大訊飛旗下的訊飛星火總分7.25，緊隨其後，並在報告撰寫能力子榜上獲得8.10的得分，遠高於GPT3.5的7.58。無論是商湯、百度的整體能力超越，還是科大訊飛的單項能力超越，都向我們傳遞出這樣一個事實：中國大模型廠商，已經具備在數字行研這一新興賽道參與國際競爭並佔得優勢的能力。而作爲內容生成領域的一個高門檻行業，這也意味着“中國隊”在AIGC的其他賽道，同樣可以佔得一席之地。

構築AI之塔的又一粒金沙

“每個行業都可以重做一遍”，是這波AIGC熱潮中被重復最多的一句話。這句話其實包含兩個方面，一是用大模型賦能改造各行各業，實現性能升級、服務升級，大幅提升產業效率，在此過程中實現大模型的商業變現；另一方面，則是依托大模型超強的智能化能力，創造新的智能化產品、服務，开拓新的賽道。數字行研恰恰就是後者的一個典型例證。

可以說，如果沒有大模型這樣強大的數字能力支撐，Kensho式的小打小鬧，也許很難形成如今刷屏金融圈的金融科技新賽道。類似的案例俯拾即是。去年年中，小冰公司开始推出網紅明星克隆人，數字人聊天平台Character.AI的移動端首周下載量甚至超過ChatGPT，其背後正是大模型以其突破性的內容生成能力，實現了數字人的個性化。用《第一財經》的話說：“AI已开始爲數字人注入靈魂。”

至於前者，微軟、阿裏、百度等國內外科技巨頭，使用大模型工具對其自身及客戶產品、平台功能的陸續改造，早已不是什么新鮮事。從行業發展來說，兩者的“雙路並進”，帶來了大模型相關行業快速增長的強勁動力。而從企業來看，這也要求他們不能拘於一隅，限制了自身的發展，而是要不斷地拓展大模型應用領域，在現有的各行各業率先實現業務落地，站穩腳跟的同時，不斷探索新的市場，才能真正實現自身業務的穩健、長期增長。

好在，從政策層到企業層，都已意識到行業落地的重要性，並正在積極推進。2023年7月發布的首部大模型監管法規《生成式人工智能服務管理暫行辦法》，首先即明確了鼓勵生成式人工智能技術在各行業、各領域的創新應用，探索優化應用場景，構建應用生態體系。今年兩會期間，大模型的落地應用也成爲代表討論的高頻詞。企業方面，就本次報告中幾家領先廠商來看，在數字行研之外的衆多領域，他們都已實現成功落地。據商湯介紹，截至去年11月底，商湯的語言大模型商量在金融、手機、醫療、汽車、地產、能源、傳媒、工業制造等衆多垂直行業，已經與超過500家客戶建立了深度合作。如果拓展到商湯公司在2023年4月發布的全系列生成式AI產品——商量、秒畫、如影、瓊宇、格物，商湯大模型產品的落地應用，正展現出強勁的發展潛能。

根據商湯2023年半年報，公司生成式AI相關收入錄得了670.4%的同比增長，對集團業務的貢獻從2022年的10.4%迅速提升至20.3%，AIGC轉型正呈現加速態勢。國聯證券研報認爲，AI大模型已开啓商湯第二增長曲线。從商湯的AIGC轉型來看，大模型廠商的業務增長模式，恰如《法華經》中“聚沙爲佛塔”的“童子戲”。對於商湯、百度、科大訊飛等一衆中國大模型廠商來說，在產業發展初期，“壘石爲屋”式的發展往往會面臨找不到石塊的窘境，因而每一粒細沙都顯得彌足珍貴。可喜的是，面對潛力十足的數字行研賽道，他們沒有錯過這粒金沙。

“大航海時代”的“小日記”

按照科技行業普遍觀點，某個技術超越科技奇點後就會產生科技大爆炸，圍繞該技術的各類應用層出不窮，繼而激活一輪新科技革命。顯而易見的是，通過GPT，AI實際上已在2023年跨越了技術奇點。2024年开始，AI正在進入“大航海時代”。

500年前的那次大航海，不僅帶來了“日不落”帝國在全世界範圍的崛起，也酝釀了當今世界唯一超級大國的雛形，世界格局發生了翻天覆地的變化。對於AI行業這場新的“大航海”來說，其在全球科技領域深遠影響也同樣顯而易見。因此，“每個行業都可以重做一遍”，對如今的大模型廠商來說，既是機遇，也是挑战。產業滲透的進展，在各個細分領域的份額，直接影響到大模型廠商在未來科技競爭中的沉浮。1月11日，微軟股價上漲，市值再次超過蘋果，成爲新年以來最受關注的事件之一，仿佛就是科技行業的一個隱喻。

市場似乎認定了在大模型研發應用上走在了前面的微軟，比遲遲不見動靜的蘋果公司，更有可能抓住未來科技領域最有價值的機遇，成爲新的“日不落”和“美利堅”。幸而，中國的大模型廠商們，也已經造好了他們的海船。以本次報告中得分高居榜首的商湯爲例，其在整個AIGC領域已構建起從算力基礎設施到模型到應用的全棧布局，公司在“大模型+大算力”的战略下，通過AI大裝置SenseCore打造出了具備自然語言處理、內容生成、自動化數據標注、自定義模型訓練等多種大模型及能力的“日日新SenseNova”大模型體系，催生了AIGC“新的研究範式”，即基於一個強大的多模態基模型，通過強化學習和人類反饋，不斷解鎖基模型新的能力，從而更高效地解決海量的开放式任務。在“日日新”大模型體系下，商湯創造出了一系列生成式AI模型及應用。

尤其值得注意的是，在AI算力需求指數式增長帶來的算力短缺背景下，商湯對智能計算基礎設施SenseCore大裝置進行持續升級，算力規模達到6ExaFLOPS，爲這艘中國大模型“海船”，提供了充足、可靠的動力。環顧全球大模型廠商，“迪亞士”們率先啓航，但也尚未走遠；“達伽馬”們未來或許不一定能發現新大陸，但开闢出通往東方的新航线，也將在“日不落”帝國的崛起中發揮重要作用；“麥哲倫、哥倫布”出發稍晚，但等在他們前方的，是最受矚目的美麗新世界。一切都還只是剛剛开始，桂冠也不止一個，唯一的問題是：路在何方？

在如今大模型應用爆發的初期，應用領域挖掘不徹底、商業模式不完善是擺在大模型廠商面前的共同難題。要尋得這些難題的破解之法，只能在更多的應用領域進行長期深入的廣泛探索，從中總結經驗，發現規律。數字行研本身只是大模型無數應用領域中微不足道的一個，但它對各家廠商們的價值，或許正在於此。讓我們再次回想500年前，當哥倫布來到美洲時，他仍在自己的航海日記中，書寫着在他看來稀松平常的見聞。但直到今天，我們都知道，這位空前偉大的航海家，不經意間已經記下了歐洲人登陸新大陸的偉大時刻。在數字行研領域“集體”反超GPT3.5的成果，或許也可以看作中國大模型廠商們，記下的一篇稀松平常的“航海日記”。我們期望，終有一天，在大模型發展的漫漫航程中，中國廠商們，也將迎來自己的“登陸時刻”。