2024年大模型行業研究報告

2024-05-15 18:40:09    編輯: robot
導讀 第一章 行業概況 1.1 簡介 大模型是指具有大規模參數和復雜計算結構的機器學習模型。這些模型通常由深度神經網絡構建而成,擁有數十億甚至數千億個參數。大模型的設計目的是爲了提高模型的表達能力和預測性...

第一章 行業概況

1.1 簡介

大模型是指具有大規模參數和復雜計算結構的機器學習模型。這些模型通常由深度神經網絡構建而成,擁有數十億甚至數千億個參數。大模型的設計目的是爲了提高模型的表達能力和預測性能,能夠處理更加復雜的任務和數據。大模型在各種領域都有廣泛的應用,包括自然語言處理計算機視覺、語音識別和推薦系統等。大模型通過訓練海量數據來學習復雜的模式和特徵,具有更強大的泛化能力,可以對未見過的數據做出准確的預測。

圖 大模型產業圖譜

來源:資產信息網 千際投行 iFinD

1.2 分類

按輸入數據類型的不同:語言大模型(NLP),視覺大模型(CV)和多模態大模型。NLP通常用來處理文本數據和理解自然語言,例如GPT系列,文心一言等。CV通常用於圖像處理和分析,例如VIT系列,文心UFO等。多模態大模型能夠處理多種不同類型數據,例如DingoDB多模向量數據庫等。

按應用領域的不同:三個層次,通用大模型L0,行業大模型L1和垂直大模型L2。通用大模型L0是指可以在多個領域和任務上通用的大模型。行業大模型L1是指針對特定行業或領域的大模型。垂直大模型L2是指針對特定任務或場景的大模型。

大模型市場容量及規模巨大,預計2028年將達到1179億元。

圖 我國大模型產業市場規模

來源:資產信息網 千際投行 iFinD

第二章 產業鏈、商業模式及政策監管2.1 產業鏈

大模型指參數規模較大的預訓練模型。這些模型通常具有數十億甚至數千億個參數,需要在大量硬件資源上進行訓練。大模型通過對數據進行分布式表示,能夠捕捉到數據中的復雜關系,提高模型在各類任務中的泛化能力。

從大模型行業產業鏈來看,上遊主要包括硬件和軟件,硬件又包括芯片、服務器、通信網絡等;軟件又包括雲計算、數據庫、中間件等。中遊是指大模型行業;下遊是指大模型的應用領域,包括遊戲、辦公、傳媒影視、醫療、金融、電商、工業等,這些領域的多樣化需求將推動大模型不斷進行技術創新和優化,提升模型的准確性和效率。

圖 大模型產業鏈

來源:資產信息網 千際投行 iFinD

通用大模型

如GPT、BERT等,能夠處理多種類型的任務,如文本生成、文本分類、機器翻譯等。

圖 國內通用大模型布局

來源:資產信息網 千際投行 iFinD

多模態大模型

能夠處理多種模態的數據,如圖像、文本、語音等,如CLIP、DALL-E等。

圖 2022-2023年主流多模態大模型

來源:資產信息網 千際投行 iFinD

AI大模型

指具有巨大參數規模的人工智能模型。這些模型通過機器學習和深度學習的技術來學習和理解龐大的數據量。AI大模型的發展推動了人工智能領域的快速發展,並在各個領域中展現出驚人的應用潛力。

圖 AI大模型譜系圖

來源:資產信息網 千際投行 iFinD

金融和投資大模型

2024年4月10日,在2024數字產業鏈金融行業峰會上,網商銀行宣布旗下的供應鏈金融解決方案大雁系統升級,AI大模型首次應用於產業鏈金融場景,提升小微企業金融服務的覆蓋率和便捷性。

在該領域上,大模型系統幫助金融和投資機構構建更全面的企業圖譜。同時,大模型有語義理解、生成能力,與大模型驅動的Agent實時反饋能力疊加,能夠更好地刻畫小微企業的經營狀況和信用情況。

圖 金融大模型的價值與作用

來源:資產信息網 千際投行 iFinD

2.2 商業模式

目前大模型商業應用尚處早期,以 API、PaaS、MaaS 三種模式爲主。當前全球大模型產業落地仍處於 早期探索階段,需要與下遊場景企業合作建立大模型商業模式,但下遊企業目前對於大模型的理解相對 有限,所需要的資源支撐比較薄弱。總的來說,大模型落地可以通過 API 接口調用付費、或者大廠提供 落地所需的开發工具、雲平台、服務等的 PaaS 模式,更進一步是直接提供相關定制好的模型調用的 MaaS 模式。

應用程序編程接口(Application Programming Interface,簡稱:API),是一些預先定義的函數,目的是提供應用程序與开發人員基於某軟件或硬件得以訪問一組例程的能力,而又無需訪問源碼,或理解內部工作機制的細節。

近年來軟件的規模日益龐大,常常需要把復雜的系統劃分成小的組成部分,編程接口的設計十分重要。程序設計的實踐中,編程接口的設計首先要使軟件系統的職責得到合理劃分。良好的接口設計可以降低系統各部分的相互依賴,提高組成單元的內聚性,降低組成單元間的耦合程度,從而提高系統的維護性和擴展性。

圖 通用大模型的主要商業模式

來源:資產信息網 千際投行 iFinD

PaaS模式(Platform as a Service)是指平台即服務。把服務器平台作爲一種服務提供的商業模式,通過網絡進行程序提供的服務稱之爲SaaS(Software as a Service),是雲計算三種服務模式之一,而雲計算時代相應的服務器平台或者开發環境作爲服務進行提供就成爲了PaaS。

所謂PaaS實際上是指將軟件研發的平台作爲一種服務,以SaaS的模式提交給用戶。因此,PaaS也是SaaS模式的一種應用。但是,PaaS的出現可以加快SaaS的發展,尤其是加快SaaS應用的开發速度。在2007年國內外SaaS廠商先後推出自己的PAAS平台。

圖 未來PaaS市場增長驅動力強勁

來源:資產信息網 千際投行 iFinD

SaaS軟件運營服務是(Software as a Service,簡稱SaaS)讓用戶能夠通過互聯網連接來使用基於雲的應用程序。常見示例有電子郵件、日歷和辦公工具。它不需要用戶將軟件產品安裝在自己的電腦或服務器上。

SaaS提供完整的軟件解決方案,用戶可以從雲服務提供商處以即用即付方式進行購买。爲組織租用應用,組織用戶即可通過互聯網連接到該應用(通常使用 Web瀏覽器)。所有基礎結構、中間件、應用軟件和應用數據都位於服務提供商的數據中心內。服務提供商負責管理硬件和軟件,並根據適當的服務協議確保應用和數據的可用性和安全性。SaaS讓組織能夠通過最低前期成本的應用快速建成投產。

圖 2021 年全球公有雲 SaaS 市場份額

來源:資產信息網 千際投行 iFinD

大模型產業市場規模持續增長,市場前景廣闊。預計2028年市場規模將達到1179億元。2022~2028年復合增長率約爲60.11%,市場規模快速成長。

圖 我國大模型產業市場規模

來源:資產信息網 千際投行 iFinD

2.3 技術發展

大模型的起源可以追溯到20世紀90年代,當時人工智能領域還處於初創期,研究人員主要關注的是基於規則的專家和知識表示系統。數據資源的不斷增加和計算機性能的不斷提升,人們开始意識到基於數據驅動的機器學習方法在人工智能領域具有更大的潛力。大模型的概念逐漸浮出水面。

近十余年間,人工智能技術泛化能力、創新能力及應用效能不斷提升,成爲了推動經濟及社會發展的重要引擎。

2015年前後,人臉識別算法達到接近人眼的識別能力,被視爲人工智能技術工業級應用水平的代表性事件。

2022年,以ChatGPT爲代表的大模型爲用戶帶來了全新交互體驗。通過其在內容生成、文本轉化和邏輯推理等任務下的高效、易操作表現,大模型正逐步成爲當前主流應用程序的重要組成部分。

圖 大模型技術發展各時期

來源:資產信息網 千際投行 iFinD

2023年7月,OpenAI向用戶正式开放了代碼解析插件Code Interpreter,使得ChatGPT和GPT-4可以根據用戶問題來編寫和執行代碼,從而拓展了模型在數據分析、復雜計算與功能調用方面的能力。

圖 全球大模型技術發展脈絡

來源:資產信息網 千際投行 iFinD

2023年,大語言模型及其在人工智能領域的應用已成爲全球科技研究的熱點,其在規模上的增長尤爲引人注目,參數量已從最初的十幾億躍升到如今的一萬億。參數量的提升使得模型能夠更加精細地捕捉人類語言微妙之處,更加深入地理解人類語言的復雜性。在過去的一年裏,大語言模型在吸納新知識、分解復雜任務以及圖文對齊等多方面都有顯著提升。隨着技術的不斷成熟,它將不斷拓展其應用範圍,爲人類提供更加智能化和個性化的服務,進一步改善人們的生活和生產方式。

圖 大模型帶來語音技術發展的全新機會

來源:資產信息網 千際投行 iFinD

2023年被視爲中國大模型的發展元年。3月16日,百度正式推出了基於百度新一代大語言模型的生成式AI產品“文心一言”,成爲了率先“跑出來”的國內大模型廠商。文心一言的問世,也拉开了國內“百模大战”的帷幕。此後,阿裏、華爲、騰訊、京東、科大訊飛、360、字節跳動等科技公司紛紛發布了自家的大模型。文心一言發布8個月後的11月15日,李彥宏在深圳西麗湖論壇上表示,國內目前已經發布了238個大模型。這意味着,在這兩百多天裏,平均每天都有一個大模型問世。

圖 國內大模型技術路线圖

來源:資產信息網 千際投行 iFinD

2.4 政策監管

大模型在快速發展的同時也帶來了一系列潛在的風險和挑战。

一方面,大模型所需的海量數據、復雜參數以及工程難度放大了人工智能固有的技術風險,如數據竊取、泄露等安全問題,模型黑盒導致決策結果難預測和難解釋問題,以及模型面對隨機擾動和惡意攻擊的魯棒性問題。

另一方面,大模型的多場景通用性也放大了隱私風險、歧視風險和濫用風險等應用風險。這些問題引發了全球範圍的關注,對人工智能治理能力與治理水平提出了新的挑战。

目前,全球大模型治理正處於探索階段,從人工智能倫理准則等基本共識出發,逐步深入推動大模型監管政策法規和企業治理落地實踐。國際組織積極制定人工智能治理原則及倡議,重點關注大模型的治理和監管問題。

圖 2023年以來國內大模型相關政策梳理

來源:資產信息網 千際投行 iFinD

在政策方面,2021年11月,聯合國教科文組織通過了《人工智能倫理問題建議書》,旨在促使人工智能系統造福人類、社會、環境和生態系統、防止危害,同時促進和平利用人工智能系統。

2023年11月,在英國人工智能安全峰會期間,包括中國、美國、英國等 28 個國家和歐盟共同籤署了《布萊切利宣言》,確保人工智能以人爲本、值得信賴並負責任,通過國際倫理和其他相關倡議促進合作,應用人工智能帶來的廣泛風險。

同年11月,世界互聯網大會發布了《發展負責任的生成式人工智能研究報告及共識文件》,就發展負責任的生成式人工智能提出十條共識。

在標准方面,ISO/IEC JTC1 /SC42人工智能分委會正在开展人工智能可信賴國際標准研制工作,爲指導利益相關方研發、使用可信賴人工智能相關技術和系統提供參考,主要標准包括 ISO/IEC TR 24028:2020《人工智能的可信賴概述》、ISO/IEC 38507:2022《組織使用人工智能的治理影響》等。

全球主要經濟體加快推進大模型治理和監管相關政策制定步伐。中國在人工智能監管方面主張“包容審慎的分類分級監管”原則,國家網信辦已於2023年7月10日頒布了首部面向大模型監管的《生成式人工智能服務管理暫行辦法》,後續將進一步針對生成式人工智能技術特點及其在有關行業和領域的服務應用,制定相應的分類分級監管規則或指引。

2023年10月8日,中國科技部發布《科技倫理審查辦法(試行)》,提出從事人工智能科技活動的單位,研究內容涉及科技倫理敏感領域的,應設立科技倫理(審查)委員會,並建立倫理高風險科技活動的清單制度,對可能產生較大倫理風險挑战的新興科技活動實施清單管理。

2023年10月18日,國家網信辦發布《全球人工智能治理倡議》,提出發展人工智能應堅持相互尊重、平等互利的原則,各國無論大小、強弱,無論社會制度如何,都有平等發展和利用人工智能的權利。

在標准方面,中國信息通信研究院已經啓動《大規模預訓練模型技術和應用評估方法》系列標准研制的工作,全面覆蓋大模型的开發、部署和應用環節,其中第四部分可信要求是目前國內首項針對大模型領域的可信賴標准。

與此同時,全國信息安全標准化技術委員會已經啓動包括《信息安全技術 生成式人工智能服務安全基本要求》在內的三項生成式人工智能安全國家標准編制工作,以支撐大模型的監管落地。

歐盟現行人工智能立法仍主要集中在傳統人工智能,但已經开始關注通用人工智能以及生成式人工智能的問題,主張尊重人格尊嚴、個人自由和保護數據及隱私安全。

2023年6月14日,歐洲議會投票通過《人工智能法案》,該法案基於風險等級將人工智能系統分成四類,並制定了不同程度的監管要求。

2023年5月13日,美國白宮總統科技顧問委員會(PCAST)成立生成式人工智能工作組,以幫助評估關鍵機遇和風險,並就如何更好地確保這些技術的开發和部署盡可能公平、負責任和安全提供意見。

2023年10月30日,美國總統拜登籤署人工智能行政令,旨在加強對人工智能潛在風險的監管,發展安全、可靠和值得信賴的人工智能,促進人工智能創新,確保美國在人工智能領域繼續領跑全球。

同時行政令在標准方面,提出美國國家標准與技術研究所(NIST)將制定嚴格的人工智能安全測試標准,人工智能系統在公开發布前需根據這些標准進行廣泛的測試以確保安全。



標題:2024年大模型行業研究報告

地址:https://www.utechfun.com/post/371245.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡