中國HPC的高潛力與AI融合的未來

2023-09-11 18:40:26    編輯: robot
導讀 前言: 如今生成式AI風頭正熱,並且又是一次新產業革命的引爆點; 而這個引爆點之所以能出現,離不开背後的HPC高性能計算與大數據基礎設施這兩點; 目前新的增長熱點出現,HPC與AI正在加速融合之中。...

前言:

如今生成式AI風頭正熱,並且又是一次新產業革命的引爆點;

而這個引爆點之所以能出現,離不开背後的HPC高性能計算與大數據基礎設施這兩點;

目前新的增長熱點出現,HPC與AI正在加速融合之中。

作者 | 方文三

圖片來源 |  網 絡 

全球正在進入HPC大周期

受益於其以更高的速度處理大量數據的能力,全球超算行業應用主要集中在生命科學、CAE、機械工程、金融、EDA、地理、機械設計、政府、學術研究、國防和氣象等領域。

根據Hyperion Research的統計數據,2022年全球超算行業市場規模爲309.55億美元,同比增長4.24%,預計今年全球HPC市場預計將增長至500億美元。

雲端HPC部署方面,根據數據顯示,2020-2022年,用戶上公有雲的速度和應用速度加快,促使HPC雲上支出增速大大高於HPC线下本地部署規模,2022年全球HPC雲上支出市場規模達到63.04億美元,同比增長23.61%。

HPC的高速發展對底層芯片提出了新的要求

一個完整的計算機系統,通常由硬件系統和軟件系統兩大部分組成,其中硬件是計算機系統運行的基石,而硬件由各種各樣的芯片集合組成。

這意味着在高性能計算高速發展的時代,對CPU、GPU、TPU、NPU、FPGA、ASIC、SoC等高性能計算芯片,以及通信芯片、接口芯片、存儲芯片等的需求量有望持續上升。

在百億級市場的積極驅動下,各大主流芯片企業皆紛紛入局高性能計算市場並加大投入,以期望在市場紅利期分得一塊蛋糕。

對於高性能計算來說,算力是第一要素,通常需要達到每秒萬億次級的計算速度,這對系統的處理器、內存帶寬、運算方式、系統I / O、存儲等都提出了更高的要求。

如何解決構建下一代超級計算機面臨的性能、延遲、功耗及安全性問題,成爲了行業關注的重點。

全球超級計算機排行榜單

超級計算機,是HPC的主要實現方式之一。

此前,HPC由於其專業度極高的特點被局限在科研實驗室、大型企業和特定的學術組織研究中。

不過隨着近兩年AI技術與IoT應用之間的互相驅動,5G將數據傳輸管道大大拓寬之後,給了數據囤積量進一步拓展的空間,讓HPC也逐漸變得日益重要。

目前,國產高性能計算機已經取得了不錯的成績。

在61期全球超級計算機 TOP500 榜單中,中國國家並行計算機工程技術研究中心(NRCPC)开發並安裝在位於中國江蘇省無錫市的國家超級計算中心的神威太湖之光以 93 Pflop/s位列第七。

神威·太湖之光超級計算機甚至曾連續獲得top500四屆冠軍,該系統全部使用中國自主知識產權的處理器芯片。

天河二號甲(銀河二號甲)是由中國國防科技大學(NUDT)开發並部署在中國廣州國家超級計算機中心的系統,目前以 61.4 Pflop/s 被列爲第十名。

天河二號採用麒麟操作系統,目前使用英特爾處理器,將來計劃用國產處理器替換。

HPC成國際芯片龍頭爭奪要地

爲了做HPC領域的領導者,英偉達、AMD、英特爾在 HPC 應用領域也是進展不斷。

迄今爲止,英偉達已推出了面向HPC和AI訓練的 Volta、Ampere、Hopper 等架構,並以此爲基礎推出了V100、A100、H100等高端 GPU。

其中Hopper H100採用台積電4 nm工藝,具有800億個晶體管,在性能、效率上遠超Ampere A100,是英偉達專爲超級計算機設計的產品。

英偉達還發布新一代GH200 Grace Hopper 超級芯片平台,是一款爲大規模AI和高性能計算應用量身打造的加速芯片。

AMD已經在高性能計算領域推出一系列性能領先的產品,涵蓋了服務器CPU、加速器,桌面CPU、移動CPU等衆多領域,全方位覆蓋數字經濟的高算力需求。此外,充分利用小芯片技術,用先進的2.5D和3D封裝技術,使AMD能夠靈活的進行異構計算解決方案系統級優化。

作爲高性能計算領域的創新引領者和推動者,英特爾近年來推出了英特爾至強處理器,英特爾至強融核處理器(Xeon Phi)、3D XPoint全新非易失性存儲技術、英特爾可擴展系統框架(英特爾SSF)以及英特爾Omni-Path架構 (Intel OPA)等衆多創新產品和技術。

英特爾基於Xe HPC微架構的數據中心GPU Ponte Vecchio是迄今最復雜的SoC,包含1000億個晶體管,提供領先的浮點運算和計算密度,以加速AI、HPC和高級分析工作負載。

未來計算架構的發展趨勢是CPU和GPU融合集成,從而形成互聯、互補、互通的融合模式,以縮小計算和存儲單元的通信成本。

HPC與AI互相融合

HPC與AI、大數據、數據分析和量子計算的融合加速了基礎設施整合,以實現從小規模、中型到EB規模的最佳性能/成本比,並創造出以前沒有涉及的新HPC業務市場。

並行化深度學習:深度學習是AI的重要分支,但在訓練大型深度神經網絡時需要大量的計算資源。

HPC技術可以通過並行化計算和優化算法,加速深度學習的訓練過程。

高性能優化:AI算法中存在很多計算密集型任務,如矩陣運算、卷積等。

通過使用高性能的計算庫、優化算法和並行計算技術,可以提高算法的計算性能和效率,減少運行時間。

分布式推理:在部署大規模AI模型時,分布式推理技術可以通過將模型分發到多個計算節點上,並利用HPC集群的計算能力,加速推理過程。

這種並行推理技術可以提高響應速度和吞吐量,適用於實時應用和大規模數據處理。

多模態融合:AI算法通常需要處理多種數據類型和模態,如圖像、語音、文本等。

通過結合HPC技術,可以實現多模態數據的並行處理和融合。

大規模數據處理:AI算法對於大規模數據的處理和分析需要強大的計算能力和存儲系統。

HPC技術可以提供高速的數據傳輸、分布式存儲和並行計算能力,以支持大規模數據的處理。

結尾:

超算基礎設施群建設已成爲各國推動科技創新的重要着力點,新一代計算系統的陸續上线爲實現更大規模、更復雜的超算應用提供了基礎。

同時,高性能計算與AI的融合在推動超算系統與應用發生巨大且迅速的變化,超算技術的發展面臨越來越多的挑战。

內容參考來源於:半導體產業縱橫:中國HPC,潛力無限

       原文標題 : AI芯天下丨趨勢丨中國HPC的高潛力與AI融合的未來



標題:中國HPC的高潛力與AI融合的未來

地址:https://www.utechfun.com/post/260852.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡