文/VR陀螺
GTC 2024,又一次產業飛躍的奠基。
北京時間 2024 年 3 月 19 日,NVIDIA 舉辦 GTC(GPU Technology Conference)大會。NVIDIA 創始人兼首席執行官黃仁勳宣布了 NVIDIA 的下一代芯片架構 Blackwell 及相關產品,包括該公司最新的 AI 芯片 B200,以及基於生成式人工智能、Omniverse 帶來的一系列雲服務與應用案例等。
這一系列的活動中,我們也看見了 XR 產業在 GPU 快速成長的 AIGC 時代的諸多可能性。本文主要以 GPU 芯片、數字孿生技術、計算機視覺、三維地圖重建與定位等與 XR 領域強相關方面,作爲切入觀察。
2080 億個晶體管,地表最強AI芯片——B200
“Blackwell 將成爲我們歷史上最成功的產品發布。”黃仁勳在會上說道。
NVIDIA 今天正式宣布 NVIDIA Blackwell 平台已經到來,爲生成式 AI 計算時代提供動力。該 GPU 平台以數學家 David Harold Blackwell 的名字命名,繼承了該公司兩年前推出的 Hopper 架構。
新 Blackwell 架構的核心是兩個新 GPU:B100 和 B200,以及一個定制解決方案 Grace-Blackwell Superchip (GB200)。其中,B200 由兩個獨立的芯片組成,通過 10 TB/秒的芯片到芯片鏈路連接,GPU 擁有 2080 億個晶體管,遠遠高於 H100 GPU 的 800 億個晶體管。
B200 (圖源:NVIDIA)
B200 一經發布,外界便賦予“地表最強 AI 芯片”之稱。Nvidia 表示,在處理大規模 AI 模型時,HGX B200 的推理性能比之前由 Nvidia Hopper 一代 GPU 驅動的系統高出 15 倍。在引擎蓋下,每個芯片都與 4 個 HBM3E 內存堆棧配對,每個 B200 GPU 具有 192GB HBM3E RAM。
據介紹,訓練一個 1.8 萬億參數的模型之前需要 8,000 個 Hopper GPU 和 15 兆瓦的電力。如今,2,000 個 Blackwell GPU 就可以做到這一點,而功耗僅爲 4 兆瓦。在具有 1750 億個參數的 GPT-3 LLM 基准測試中,GB200 的性能是 H100 的七倍,訓練速度是 H100 的四倍。
爲了確保訓練最復雜的人工智能模型的快速連接,Nvidia 還推出了第五代 NVLink,它爲每個 GPU 提供突破性的 1.8TB/s 雙向吞吐量,可實現多達 576 個 GPU 的無縫高速通信。
GB200,兩個 GPU、一個 CPU、一塊主板(圖源:NVIDIA)
將兩個 GPU 與單個 Grace CPU 結合在一起的 GB200 可以爲 LLM 推理工作負載提供 30 倍的性能,同時還可能大幅提高效率。
對於需要超級計算機級計算的更大型的應用,Nvidia 推出了新的 Nvidia GB200 NVL72,據稱它可以勝任訓練萬億參數模型的任務。
GB200 NVL72 是一款定制機架解決方案,採用多節點液冷 Nvidia GPU 服務器。它提供 72 個 Blackwell GPU 和 36 個 Grace CPU 起的配置,並作爲單個系統提供 1.4 exaflops 的 AI 性能和 30TB 的快速內存。
爲了獲得最高的 AI 性能,GB200 驅動的系統可以與 NVIDIA Quantum-X800 InfiniBand 和 Spectrum™-X800 以太網平台連接, 這些平台可提供速度高達 800Gb/s 的高級網絡。
值得注意的是,英偉達表示應用程序將能夠一致地訪問統一的內存空間。這簡化了編程並支持萬億參數 LLM、多模式任務的變壓器模型、大規模模擬的模型以及 3D 數據的生成模型的更大內存需求。
GB200 NVL72(圖源:NVIDIA)
GB200 NVL72 實際上與 Nvidia 過去的 DGX 系統中使用的技術相同,使 8 個 GPU 表現得像一個 GPU。不同之處在於,使用專用的 NVLink 設備,Nvidia 能夠支持更多的 GPU。
強大的 GPU 不僅能爲 AI 訓練提供強有力的底層支持,對於高質量圖形圖像要求的 XR 硬件而言,更是猶如一把利刃,可以直接或間接推動相關內容產業以及硬件的發展(長线視角)。
全新的 GPU 系列外,英偉達的工業元宇宙平台 NVIDIA Omniverse 在今年也迎來了新的升級。
Apple Vision Pro用Omniverse“拓展”未來渲染
以 Cloud API,打造更开放的 Omniverse 平台。
NVIDIA 於今日宣布將以 API 形式提供 Omniverse™ Cloud。借助五個全新 Omniverse Cloud 應用編程接口(API),开發者能夠輕松地將 Omniverse 的核心技術直接集成到現有的數字孿生設計與自動化軟件應用中,或是集成到用於測試和驗證機器人或自動駕駛汽車等自主機器的仿真工作流中。
五個全新 Omniverse Cloud API 既可單獨使用,也可組合使用。它們分別是:
USD Render:生成 OpenUSD 數據的全光线追蹤 RTX™渲染USD Write:讓用戶能夠修改 OpenUSD 數據並與之交互USD Query:支持場景查詢和交互式場景USD Notify:追蹤 USD 變化並提供更新信息Omniverse Channel:連接用戶、工具和世界,實現跨場景協作
基於 Omniverse Cloud API 或應用程序編程接口構建的新軟件框架,使开發人員可以輕松地將其通用場景描述 (OpenUSD)工業場景從內容創建應用程序發送到 NVIDIA 圖形交付網絡 (GDN),全球圖形就緒數據中心網絡,可以將 3D 體驗傳輸到遠程硬件設備中。
大會上的演示中,Nvidia 展示了一個完全交互式的汽車模型,該模型被傳輸到 Apple Vision Pro 頭顯中。蘋果 Vision 產品集團副總裁 Mike Rockwell 表示:“Apple Vision Pro 突破性的超高分辨率顯示器與 NVIDIA 加速計算流式傳輸的 OpenUSD 內容的真實感渲染相結合,爲推進沉浸式體驗帶來了絕佳的機會。”
該工作流程還引入了混合渲染,這是一種在設備上結合本地和遠程渲染的突破性技術。用戶可以使用來自 GDN 的 Omniverse RTX 渲染器流,通過 Apple 的本機 SwiftUI 和 Reality Kit 在單個應用程序中渲染完全交互的體驗。
據介紹,這種基於 Omniverse 的全新工作流程將 Apple Vision Pro 突破性的高分辨率顯示器與 NVIDIA 強大的 RTX 雲渲染相結合,只需設備和互聯網連接即可提供空間計算體驗。
基於雲的方法允許實時基於物理的渲染無縫傳輸到 Apple Vision Pro,提供高保真視覺效果,而不會影響大量工程保真度數據集的細節。
從長遠發展角度來看,雲服務的確是降低產品側功耗,提升用戶多樣化體驗的必經之路,不過,大量數據的傳輸,同樣需要較高的帶寬網絡服務。當然,強大的雲端服務渲染與硬件的結合,也是理想化的數字孿生世界中的基建。
Earth-2 氣候數字孿生雲平台,速度與精度的新結合
在 AI 的助推下,數字孿生正在悄然發生變化。
爲加速應對氣候變化導致的極端天氣所造成的經濟損失,NVIDIA 於還發布了 Earth-2 氣候數字孿生雲平台,使天氣和氣候的模擬和可視化達到前所未有的精度。
NVIDIA 創始人兼首席執行官黃仁勳表示:“如今氣候災害很常見,新聞中時常會看到歷史性的幹旱、災難性的颶風和百年不遇的洪水。Earth-2 雲 API 將幫助我們更好地應對極端天氣,使我們可以採取行動以緩解極端天氣的影響。”
作爲同於今日發布的 NVIDIA CUDA-X™ 微服務的一部分,NVIDIA DGX Cloud™ 上的全新 Earth-2 雲 API 能夠支持所有用戶創建基於 AI 的仿真,從而加快實現交互式、高分辨率模擬的速度,模擬範圍從全球大氣和局部雲層到台風和湍流。
當前氣候技術行業的規模已達 200 億美元,Earth-2 應用編程接口通過結合該行業的公司所擁有的專有數據,可幫助用戶在數秒內發布預警和最新預報。而使用傳統模型在 CPU 上運行,這一過程需要耗時數分鐘乃至數小時。
Earth-2 API 提供各種 AI 模型,並且新添加一種名爲 CorrDiff 的全新 NVIDIA 生成式 AI 模型。該模型基於領先的擴散模型技術,能將當前數值模擬的分辨率提升 12.5 倍,相比傳統方法,速度和能效分別提升了 1000 倍和 3000 倍。它不僅可以糾正粗分辨率預報中的錯誤,還能夠生成對決策至關重要的指標。CorrDiff 是一個开創性的生成式 AI 模型,能夠實現超分辨率,生成利益相關方感興趣的新指標,並且可以從高分辨率數據集中學習小範圍局部天氣的物理特性。
Earth-2 雲 API 的另一個關鍵組成部分是 NVIDIA Omniverse™,該計算平台可幫助個人和團隊开發基於通用場景描述(OpenUSD)的 3D 工作流與應用。
Earth-2 API 使用 DGX Cloud 爲氣候和天氣解決方案提供全棧加速,其中包括 FourCastNet、GraphCast 和 Deep Learning Weather Prediction 等模型的最佳 AI 實現、在最新 Grace Hopper 系統上對 ICON 等數值天氣預報模型的 GPU 加速等。在 NVIDIA DGX GH200、HGX H100 和 OVX 超級計算機上運行的 Earth-2 在進行全球氣候模擬和可視化上實現了前所未有的速度與精度。
Isaac Perceptor軟件开發工具包,內含XR猛料?
作爲本次 GTC 活動的彩蛋之一,演講接近尾聲之時,黃仁勳展示了來自迪士尼研究院的一對由 NVIDIA 驅動的小型機器人。
GPU——AIGC——機器人,三者無疑是生成式人工智能時代最完美的結合體。爲了幫助機器人更好地感知所處環境,黃仁勳還發布了 Isaac Perceptor 軟件开發工具包,該工具包具有最先進的多攝像頭視覺裏程計、3D 重建和佔用地圖,以及深度感知功能。
爲了使機械臂更具適應性,NVIDIA 宣布推出 Isaac Manipulator —— 一個先進的機械臂感知、路徑規劃和運動學控制庫。
最後,黃仁勳宣布了 Project GR00T,這是一個爲人形機器人設計的通用基礎模型,旨在進一步推動 NVIDIA 在機器人技術和具身智能方面的突破性工作。
爲了支持這一努力,黃仁勳推出了一款用於人形機器人的新型計算機 Jetson Thor,它基於 NVIDIA Thor 系統級芯片,並對 NVIDIA Isaac 機器人平台進行了重大升級。
黃仁勳表示:“計算機圖形學、物理學和 AI 是 NVIDIA 的靈魂所在,生成式 AI 時代一切改變都有可能發生。”
事實上,除了機器人應用之外,從 Isaac Perceptor 軟件开發工具包包含的技術,特別是多攝像頭視覺裏程計、3D 重建和佔用地圖,以及深度感知功能,與 XR 有着千絲萬縷的聯系。
通常情況下,一個支持 6DoF 的 VR/MR 頭顯不僅需要內置 IMU、還需要相應的外部追蹤系統與 SLAM 算法、去識別和標記周圍環境,以及自己的位置,以此重建三維視圖。而目前 XR 設備中最常用的就是基於攝像頭的計算機視覺技術,包括 Quest 3、Vision Pro 等。
這一基礎原理與 AI 機器人在三維視覺地圖重建上,其實有着異曲同工之處。對於 NVIDIA 而言,拓展 XR 算法與渲染也許並不難。就目前來看,僅是時間節點與關注度問題。
寫在最後
從底層 GPU 硬件,到以 Omniverse 爲主的數字孿生技術生態,Isaac Perceptor 軟件开發工具包,NVIDIA 正在無形之中參與空間計算的革命浪潮。
至於 XR 如何才能真正乘上 AIGC 風口,迎來空間計算時代的小爆發,且讓子彈再飛一會兒。
參考資料:https://nvidianews.nvidia.com/news/
原文標題 : 最強AI核彈!英偉達將成空間計算時代最大推動力
標題:最強AI核彈!英偉達將成空間計算時代最大推動力
地址:https://www.utechfun.com/post/348524.html