誰率先摘到了大模型的果實？

2024-04-03 18:40:18 編輯： robot

導讀來源 | 伯虎財經（bohuFN）作者 | 陳平安 2022年底，OpenAI用chatGPT再度點燃了人工智能的狼煙，一場名爲大模型的競賽瞬間席卷了全球。但到了今天，大家討論最多的不再是規模、...

來源 | 伯虎財經（bohuFN）

作者 | 陳平安

2022年底，OpenAI用chatGPT再度點燃了人工智能的狼煙，一場名爲大模型的競賽瞬間席卷了全球。

但到了今天，大家討論最多的不再是規模、算力。即便當下AGI已經成爲了一種共識，行業大佬們言之鑿鑿：AGI很有可能在5年內成爲現實，但隨着大模型混战進入下半場，無論是投資人還是大廠，更關心的是如何率先讓大模型商業化成爲可能。

3月26日，商湯集團（下簡稱“商湯”）發布截至 12 月 31 日的 2023 財年業績報告。其中一個值得注意的地方是，2023 年，商湯生成式 AI 業務收入達 12 億元。這也是商湯成立十年以來，最快達到10億收入體量的新業務。

作爲此前國內最炙手可熱的AI公司，商湯在生成式 AI 業務上的進展，不僅僅意味着其本身正在走入新時代，對於正在尋求商業化的同行們來說，或許也能提供一些借鑑意義：

商湯是怎么做到的？

01 商業化閉環

和2022年相比，2023年商湯生成式 AI 業務的收入爆發式增長200%，整體佔比也從10% 增長到 35%。

這得益於商湯對於生成式AI的战略重視。

2023年，商湯把自身業務明確劃分爲生成式 AI、傳統 AI 和智能汽車，而此前的智慧城市、智慧商業和智慧生活中的非生成式AI業務，則被並入到傳統AI業務內。商湯的愿景和战略目標也轉變爲“將 AGI 作爲核心战略目標，以期在未來幾年內實現 AGI 技術的重大突破”。

這么做的原因是，生成式 AI 業務需要足夠聚焦的投入。在Scaling Law（尺度定律）的指引下，大量的投入是最基礎的事情。根據紐約時報援引對OpenAI創始人山姆.奧特曼的採訪，ChatGPT每天要消耗的電量就高達50萬度。

OpenAI發布chatGPT後，商湯是反應最迅速最持續的廠商之一。去年4月10日，商湯正式公布“日日新 SenseNova”大模型體系。到今年2月，日日新大模型已經迭代了四個版本，來到了日日新 V4.0。據報道，日日新 V4.0在代碼編寫、數據分析、醫療問答等多個場景中達到與 GPT-4 相匹配的能力。

如果說對於大模型的持續投入是基礎，那么對於現實需求的准確判斷則是商湯生成式 AI 業務迅猛發展的點金手。

目前包括手機、電腦、社交、醫療、金融等在內的多個領域，AI都是行業發展和競爭的重要比拼維度。比如智能手機行業，一個能夠聽取用戶的指令，並調用手機上的各類應用程序完成復雜任務的智能終端模型已經被放到了重要賣點。

但由於訓練通用大模型的成本太高，更多的廠商們更傾向於通過直接調取API的方式來獲得生成式AI的能力。

商湯新的「模型即服務」（MaaS）的商業模式正好適配這股暴漲的需求。通過在大裝置微調和調用各類生成式 AI 能力，客戶不需要自己去搭建基礎設施，大大降低了成本。

一般來說，場景有三個：一是公有雲標准，調用 API；二是私有雲，對於安全需求客戶提供專屬模型和模型授權服務；三是模型定制服務。

比如包括招商銀行、中國銀行等在內的多家知名銀行已經採用日日新大模型去構建數字客服系統；鄭州大學第一附屬醫院、上海交通大學醫學院附屬新華醫院、上海交通大學醫學院附屬瑞金醫院等，選擇運用“大醫”賦能用藥咨詢、患者隨訪、臨牀輔助決策等衆多醫院真實業務場景。

財報提到，在企業端，生成式 AI 業務中超過 70% 的客戶是商湯在過去一年內的新增客戶，而剩下 30% 的存量客戶的客單價也錄得了約 50% 的增速。在C端，日日新大模型賦能 C 端的調用量更是在半年內增長近120倍。

生成式 AI 業務的發展也推動了傳統AI業務和智能汽車業務的變革。以智能汽車業務爲例，作爲AI技術和傳統制造結合的最大落地場景，大模型的影響力也在持續。隨着特斯拉在美國推送智能駕駛軟件FSD v12 Beta版，基於大模型架構的端到端技術方案成爲了下一代自動駕駛的最優解。

得益於自家大模型的基礎能力，商湯的“絕影”智能汽車業務迎來了迅速增長：量產交付同比大幅增長163%，營收同比增長31%。

不過無論是大模型能力的訓練，還是端側大模型的部署，都是一個長期且困難的事，商湯大舉投入的底氣在哪？

02 AI2.0的賽點

在科技行業的語境裏，AI並不是一個新詞。

以2017年Transformer算法的誕生爲分界线，AI被劃分爲兩個時期。前者多聚焦於參數量較小的小模型，針對特定場景獲得特定能力，後者則更通用，更基礎。

但這並不意味着，過去企業在AI1.0時代的積累和經驗，無法在AI2.0時代發揮作用。恰恰相反，商湯過去在感知智能、決策智能等方面的積累，是其生成式AI業務得以快速發展的關鍵之一。

一方面，AI1.0時代，商湯不僅在計算機視覺方面積累了大量算法模型，覆蓋從視覺信號的分析理解到實現數字內容的生成等各方面；也自研並具備了包括語音識別(ASR)、語義理解（NLP/ 知識圖譜）、語音合成（TTS）以及語音動畫合成（STA）等多項技術能力。這些都能有效強化其基礎模型對物理世界的理解和多模態能力。

比如在智能終端領域，得益於商湯在小模型上的積累，同樣是7B模型，商湯的性能領先於Meta的Llama2和谷歌的Gemma。2023年，高通、MTK在發布會上展示了商湯子公司慧鯉生成式AI端側模型在其旗艦芯片上的應用成果：商湯的7B級小型模型在高通最新款芯片上，實現了業界領先的16tokens/秒的推理速度。

另一方面，在大力發展生成式AI業務之前，商湯的AI能力就賦能了不少垂直行業：包括智慧城市、智慧商業、智能汽車和智慧生活等在內的四大板塊，涉及了20多個落地場景，其中不乏我們熟悉的手機、金融、醫療等。這讓商湯更能洞察當下各行各業對於生成式AI的需求到底在何處，如何針對需求去做供給。

更重要的是，過去商湯在基礎設施上的前瞻布局，正在發揮巨大作用。

如果說工業革命時代的基礎設施是電力、鐵路、運河、港口，那么大模型時代的基礎設施則是以GPU爲代表的算力。OpenAI首席執行官奧特曼曾表示，“算力是這個時代最重要的貨幣”。這既關乎成本，也關乎效率。

早在2018年，商湯就着手自建算力中心，並在此基礎上打造了SenseCore AI大裝置。2022年，商湯在上海臨港的智算中心AIDC正式運營，是亞洲最大的人工智能計算中心之一，並在2023年擴展了上海、深圳、廣州、福州、濟南、重慶等新的計算節點。

業績公告顯示，商湯大裝置總算力達到12000petaFLOPS，相較於2023年初提高了一倍，GPU數量達到45000卡，實現了萬卡萬參的大模型訓練能力。

算力只是商湯大裝置的計算基礎設施，在此之上還包括模型層、深度學習層兩個架構，分別對應算法模型生成和算法模型訓練。

爲了提高算力的供給效率，商湯聯合开發了DeepLink开放計算體系。基於此，各類國產芯片可以輕松適配主流的大模型訓練框架和算法庫。今年，商湯還增加了對華爲昇騰、寒武紀等主流國產芯片的適配，支持大模型的訓練、微調和推理服務，從而通過提供規模化、高效率、集約化的算力基礎設施服務，大幅提高算力的利用能力。

簡單來說，就是降本增效。

根據報道，目前商湯大裝置在大模型訓練服務上可以保持90%的加速效率，提供30天穩定訓練不間斷的服務，並將出現訓練間斷時的診斷恢復時長也優化到了半小時。

同時，商湯大裝置還支持20個億參數量超大模型（以千卡並行）並行訓練，並新增了對多模態模型和混合專家模型的支持。

這也是爲什么商湯可以頂住壓力，成爲少數可以高速迭代大模型的企業之一。自 2023 年發布以來，商湯“日日新”大模型的能力每隔三個月都會有顯著提升。根據弗若斯特沙利文發布的《AI大模型市場研究報告(2023)》，商湯的AI大模型在產品技術、战略愿景、生態开放構建等綜合競爭力，在2023年位列國內第一。

03 共創的未來

IDC最新發布的2024年V1版《全球人工智能和生成式人工智能支出指南》顯示，無論是投資規模還是市場規模，AI行業都處於高速增長當中。

2022年全球人工智能（AI）的IT總投資規模爲1324.9億美元。預計到2027年，這一數字將增至5124.2億美元，年復合增長率爲31.1%。特別是生成式AI技術，預計到2027年將佔據33.0%的中國AI市場投資份額。

IDC還特別提及了生成式AI市場的年復合增長率可能達到85.7%，到2027年，全球生成式AI市場規模將接近1500億美元。

但正如紅杉中國去年發布的一篇文章所預測，當下AI浪潮的重心是如何利用新技術端到端地解決現實社會中的問題：模型能力和商業化路徑本就是一體兩面的關系。這既有賴於共創，也需要自身的努力。

這恰是商湯潛力的體現。

根據財報，商湯大裝置的降本增效能力已賦能多個領域頭部企業機構，其中既包括小米、閱文等行業“燈塔”，也有上海交大等頂尖機構。

“大裝置+大模型”的深度協同優勢也讓商湯可以在保持技術優勢的同時，把技術賦能到其他行業。根據官方透露，商湯將於今年4月的技術交流日上，推出“日日新”大模型5.0版本，預期其多模態能力將對標GPT4V。

簡單來說，當下商湯既是“電”的提供人，也是“鐵路”的鋪設者。

正如商湯董事長兼 CEO 徐立所言，“生成式 AI 對商湯來說已不僅僅是技術領域的變革性創新，更成爲公司的核心業務。商湯生成式 AI 業務的增長，得益於各行各業對大模型的訓練和推理的廣泛需求，這預示着中國硬科技投資的新周期正式开啓。商湯通過在各業務層面深入融合生成式 AI 能力，正在贏得新客戶，並推動效率和生產力的全面提升。”