根據外媒報導,GPU 大廠輝達 (NVIDIA) 針對高效能運算 (HPC) 和人工智慧 (AI) 市場需求的下一代 Blackwell GB100 GPU,預計將有重大的變革,那就是全面採用小晶片 (Chiplet) 的設計。
該項報導點出了兩件關鍵事項,首先是 NVIDIA 現在預計將其首款 Chiplet 設計用於現代資料中心領域,這與先前市場傳聞 NVIDIA 將繼續使用標準的單片設計的想法有了很大的不同。然而,即便 Chiplet 和單晶片設計都有各自的優缺點,但考慮到當今要達成性能提升所需的成本和效率,Chiplet 和先進的封裝技術正在被 AMD 和英特爾等競爭對手所採用的情況下,NVIDIA 似乎也不得不妥協。
事實上,到今天為止,NVIDIA 已經證明晶片發展無需使用 Chiplet 也能達成其性能的提升。因為旗下的 Hopper 和 Ada Lovelace 系列GPU 均提供了該公司有史以來的最佳每瓦性能和最大價值。但展望未來,這種情況將會改變,預計從 Blackwell 系列 GPU 開始,市場可能會看到 NVIDIA 的第一個Chiplet 的晶片設計架構。而根據先前 NVIDIA 的宣布,Blackwell 系列 GPU 計劃於 2024 年針對於資料中心和人工智慧市場發表。
值得注意的是,在外媒談論到 Blackwell 系列時,強調了資料中心和人工智慧市場的需求。這代表 NVIDIA 可能尚未針對代號為 Ada-Next 的消費型 GPU 進行 Chiplet 的架構設計。其原因預期是在資料中心和人工智慧市場需求的 GPU 上,藉由導入 Chiplet 設計架構,將一定程度採用具有性能優勢封裝技術,以最大化的提高晶片運算效能。然而,Chiplet 架構設計的缺點,就在於不容易尋到合適的廠商來封裝這些晶片。
當前,台積電的 CoWoS 是 AMD 和 NVIDIA 等 GPU 客戶可以使用的先進封裝技術之一,而且兩家公司當前也可能正在競爭台積電該先進封裝技術的產能。而這樣的競爭神能夠取得優勝,通常取決誰有更多的現金籌碼,這使得 NVIDIA 當前看來較有競爭優勢。
除此之外,Blackwell 系列 GPU 採用 Chiplet 設計架構之後,其內部的 GPC、TPC 等單元數量與Hopper 相較雖然不會有太大的變化。但是,內部單元結構可能暗示 SM/CUDA/Cache/NVLINK/Tensor/RT 數量發生了顯著變化。另外,還有市場傳言指出, NVIDIA 正在評估三星 3GAA 節點製程,預計在 2025 年進入量產。但對此,報導認為 NVIDIA 應該不會改變計劃,並堅持使用台積電的製程來生產下一代 GPU。
由於 NVIDIA 自推出 Pascal 系列 GPU 以來,在人工智慧和資料中心方面取得的進步,以及 Ampere 和 Hopper 等系列 GPU 的巨大成功,Blackwell 系列 GPU 的設計結構改變,將代表著 NVIDIA GPU 產品的令一項重大進步,也進一步推動該公司進入人工智慧和計算的下一個時代。
(首圖來源:輝達提供)
標題:NVIDIA 在 AI 晶片將有重大變革,Blackwell 系列將採 Chiplet 架構
地址:https://www.utechfun.com/post/263931.html