今年以來,我國大模型產業駛入“百模”大战時代,賽道熱度空前,大战愈演愈烈。在本月初舉行的2023全球數字經濟大會人工智能高峰論壇上,北京市經濟和信息化局黨組書記、局長姜廣智表示,現在全國已有80余個大模型公开發布。
“百模”
“百模”實則大模型產業領域中各家企業發布的大模型,目前,大模型及其產品主要分爲三類。第一類是通用大模型,如OpenAI的ChatGPT、百度的‘文心一言’、科大訊飛的‘星火’等都屬於通用大模型;第二類是行業大模型;第三類是基於通用大模型或行業大模型的應用型服務。目前已經發布的產品大多集中在第一類和第二類。
從全球已經發布的大模型分布來看,中美兩國數量合計佔全球總數的超 80%。有專家披露,據不完全統計,目前中國 10 億參數規模以上的大模型已發布 79 個。那么,國內又有哪些大模型?
華爲:盤古大模型
7月7日-9日,盤古大模型3.0在華爲开發者大會2023上正式發布,由 5+N+X 三層架構組成。
L0 基礎大模型:包含五個基礎大模型:中文語言(NLP)大模型、視覺(CV)大模型、多模態大模型、科學計算大模型和圖網絡(Graph)大模型。
L1 行業大模型:涵蓋N 個行業大模型,已推出了盤古金融大模型、盤古礦山大模型、盤古氣象大模型、盤古電力大模型、盤古制造質檢大模型、盤古藥物分子大模型等行業大模型。
L2 場景模型:爲客戶提供更多細化場景,它更加專注於某個具體的應用場景或特定業務,爲客戶提供开箱即用的模型服務。例如基於氣象大模型的短臨氣象預報、台風預測等場景模型;基於電力大模型的無人機電力巡檢、電力缺陷識別等場景模型;基於時尚大模型的時尚輔助設計、時尚版權保護等場景模型。
截至目前,盤古大模型已深入金融、制造、政務、電力、煤礦、醫療、鐵路等 10 多個行業,支撐起 400 多個 AI 業務場景的應用落地。
百度:文心一言
2月7日,百度正式宣布推出文心一言(ERNIE Bot),文心一言是基於文心大模型技術推出的生成式對話產品,底層技術基礎是文心大模型,底層邏輯是通過百度智能雲提供服務,吸引企業和機構客戶使用API和基礎設施,共同搭建AI模型、开發應用,實現產業AI普惠。
文心大模型包括NLP大模型、CV大模型、跨模態大模型、生物計算大模型、行業大模型。目前,文心大模型已經迭代至3.5版本,與3.0版本相比,訓練速度提升了2倍,推理速度提升了17倍,模型效果累計提升超過50%。
據百度官方表示,文心一言大模型的訓練數據包括了萬億級網頁數據、數十億的搜索數據和圖片數據、百億級的語音日均調用數據,以及5500億事實的知識圖譜等。
騰訊:混元大模型
基於騰訊強大的底層算力和低成本的高速網絡基礎設施,2022 年底騰訊發布了低成本、可落地的NLP萬億大模型——混元(HunYuan)AI 大模型。
混元AI大模型採用騰訊太極機器學習平台自研的訓練框架AngelPTM,相比業界主流的解決方案,太極AngelPTM單機可容納的模型可達55B,20個節點(A100-40Gx8)可容納萬億規模模型,節省45%訓練資源,並在此基礎上訓練速度提升1倍。
在模型層,混元大模型完整覆蓋 NLP 大模型、 CV 大模型、多模態大模型、文生圖大模型及衆多行業、領域、任務模型。其中,HunYuan-NLP 1T 的模型能力在自然語言理解任務榜單 CLUE 中登頂。
在產業化方面,混元先後支持了包括微信、QQ、遊戲、騰訊廣告、騰訊雲等衆多產品和業務,通過 NLP、CV、跨模態等 AI 大模型,不僅爲業務創造了增量價值而且降低了使用成本。特別是其在廣告內容理解、行業特徵挖掘、文案創意生成等方面的應用,在爲騰訊廣告帶來大幅 GMV 提升的同時,也初步驗證了大模型的商業化潛力。
阿裏:通義千問
2022年9月,在阿裏巴巴達摩院主辦的世界人工智能大會“大規模預訓練模型”主題論壇上,達摩院副院長周靖人發布阿裏巴巴“通義”大模型系列,並宣布相關核心模型向全球开發者开源开放。
通義大模型打造了業界首個AI(人工智能)統一底座,在業界首次實現模態表示、任務表示、模型結構的統一。以統一底座爲基礎,達摩院構建了層次化的模型體系,其中通用模型層覆蓋自然語言處理、多模態、計算機視覺,專業模型層深入電商、醫療、法律、金融、娛樂等行業。
目前,通義大模型系列已在超過200個場景中提供服務,實現了2%~10%的應用效果提升。典型使用場景包括電商跨模態搜索、AI輔助設計、开放域人機對話、法律文書學習、醫療文本理解等。
京東:言犀大模型
7月13日,京東言犀大模型在2023京東全球科技探索者大會暨京東雲峰會上推出。與通用大模型相比,靈犀大模型融合70%通用數據與30%數智供應鏈原生數據,具有“更高產業屬性、更強泛化能力、更多安全保障”的優勢。
同時,京東還推出了一套大模型的完整工具,包括支撐大模型研發的基礎設施——言犀AI开發計算平台、向量數據庫、混合多雲操作系統雲艦、高性能存儲平台雲海、軟硬一體虛擬化引擎京剛等核心產品。
該模型的落地應用路线圖“125”計劃也已公布,包括一個平台、兩個領域和五個應用。其中,一個平台爲ChatJD智能人機對話平台,兩個領域爲零售和金融,五個應用則包括內容生成、人機對話、用戶意圖理解、信息抽取和情感分類。
360:360智腦大模型
6月13日,360集團正式召开“360智腦大模型”應用發布會,發布認知型通用大模型“360智腦4.0”,並宣布360智腦已經接入360旗下產品“全家桶”中。
據介紹,本次發布的“智腦大模型”已經具備四大核心能力,包括文字處理能力、圖像處理能力、語音處理能力以及視頻處理能力,可實現文生文、文生圖、文生表、圖生圖、圖生文、視頻理解等功能。
360選擇了大而全路线,對標微軟的全家桶。當前,360智腦已具備生成與創作、多輪對話、代碼能力、文本分類、文本改寫、閱讀理解、邏輯與推理、知識問答、多模態、翻譯等十大核心能力,維度涵蓋數百項細分功能。
科大訊飛:星火認知大模型
5月6日,科大訊飛星火認知大模型正式發布,涵蓋了文本生成、語言理解、知識問答、邏輯推理等七項核心能力,並持續迭代於6月9日再次升級發布星火認知大模型V1.5。
目前,科大訊飛圍繞星火認知大模型,以一平台 + 多賽道的“1+N”模式,將業務範圍延展到包括开放平台、智慧教育、智慧醫療、智慧城市、運營商在內的多個領域。其中,“1”是指以通用認知智能大模型算法研發及高效訓練底座平台,“N”則是針對於多個行業領域的專用大模型版本,其中,包含教育、醫療、汽車、人機交互、辦公、翻譯、工業等。
所有產品都值得用大模型重做一遍
“所有產品都值得用大模型重做一遍。”在2023年阿裏雲峰會上,阿裏巴巴集團董事會主席兼CEO張勇說道。
放到應用層面來理解,玩家都期待借着這個風口,把自家產品包裝一下再重新推廣出去。所以,目前各家的大模型都與本身業務類型相關。這也就說明,目前國內的“百模”大战,大模型的內卷仍是互聯網企業主流業務的競爭。
小結:
大模型產業是未來科技競爭的關鍵較量之一。有些專家認爲,聚焦細分領域有可能讓成本降低,讓大模型在領域落地和成本優化方面進展更快才能真正普惠更多用戶。
有些專家對此持相反觀點,認爲:細分行業只存在於“中模型”,不存在於”大模型“,只有覆蓋多個行業、通用才叫大模型,畢竟“百模大战”最終拼的是場景落地能力。
如何率先突圍,仍然需要時間的檢驗。
原文標題 : 資本 | 說不盡的“百模”大战
標題:說不盡的“百模”大战
地址:https://www.utechfun.com/post/241223.html