到本世紀末,全球人工智能市場將爲世界經濟貢獻高達 15.7 萬億美元。各行各業的領導者都押注於人工智能在簡化運營、提高生產力、創造收入和支持創新方面的潛力。
然而,人工智能是一項能源密集型技術。據估計,爲人工智能提供支持的服務器一年的用電量可能與瑞典或阿根廷大小的國家相當。運行人工智能工作負載所需的高性能計算 (HPC) 環境比傳統工作負載消耗的電量多 300 到 1,000 倍,因此產生的熱量要多得多。這意味着數據中心必須消耗更多的能源來適當冷卻服務器,使其可靠運行。
釋放人工智能的全部潛力可能需要組織在其ESG目標上做出重大讓步,除非該行業大幅減少人工智能的環境足跡。這意味着所有數據中心運營商——包括內部團隊和第三方合作夥伴——必須採用創新的數據中心冷卻能力,同時提高能源效率和減少碳排放。
在保持高性能的同時提高冷卻效率的三個策略
對高性能計算能力的需求並不是人工智能所獨有的。網格計算、集群和大規模數據處理等技術都依賴於HPC來促進分布式工作負載、協調復雜任務和跨多個系統處理大量數據。
然而,隨着人工智能的迅速崛起,對 HPC 資源的需求激增,這加劇了對先進基礎設施、能源效率和可持續解決方案的需求,以管理相關的電力和冷卻要求。特別是,支持復雜人工智能模型和深度學習算法所需的大型圖形處理單元 (GPU) 產生的熱量比傳統 CPU 多,這給數據中心的設計和運營帶來了新的挑战。部署需要支持可能不需要液體解決方案的存儲和網絡解決方案。
這些挑战需要尖端的冷卻技術和節能系統來確保最佳性能,而不會影響可持續發展目標。爲了獲得最佳效果,數據中心將需要採用空氣和液體冷卻解決方案的組合,這些解決方案可以靈活地滿足每個部署的特定要求:
現代化的 CRAC 技術
傳統的計算機房空調 (CRAC) 系統依賴於集中式空氣分配,其中冷空氣從有限數量的點吹過整個房間。這種方法適用於低密度設置,因爲服務器之間的散熱相對均勻,但它很難滿足充滿熱密集型 GPU 系統的高密度環境的需求。
相比之下,現代 CRAC 系統使用復雜的冷卻技術,如變速風扇和節能器來動態控制整個數據中心的冷卻。這種方法針對熱點,實時調整氣流以反映實際環境條件。因此,現代 CRAC 系統比其前身更節能,提供了專爲波動的工作負載而設計的可擴展解決方案。
可替代空氣輸送
使用可替代空氣輸送系統的數據中心可以在房間、行和機架級別定制冷卻資源。這些量身定制的解決方案支持雙重性能和可持續性要求。
- 在房間層面:模塊化冷卻可以战略性地放置,將空氣引導到最需要的地方。例如,當房間布局改變或安裝新設備時,可能會調整氣流。冷熱通道封閉等技術——將服務器機架交替排列,冷空氣從一側流入另一側流出——也有助於防止空氣混合,從而實現更有效的冷卻。
- 在排級:專用冷卻裝置集成在每排機櫃中,可有效地向高密度區域輸送更多空氣。隨着行配置的改變,這些單元可以重新定位或調整。
- 在機架級別:直接到機架冷卻提供了更有針對性和更高效的空氣輸送。雖然採用機架級單元會增加成本和復雜性,但它會顯著降低高溫區域的溫度。
液體冷卻技術
先進 AI 系統產生的大量熱量很難僅通過空氣循環進行冷卻。液體冷卻與空氣冷卻方法協同工作,以抵消高密度機架周圍的熱量,防止與電源和熱量相關的故障。業界認爲 30-35kw 是典型的交叉點,此時液體更有意義,並且可以更有效地降低 TCO。然而,在許多 DC 環境中,例如 Flexential 的環境,可以支持更高密度的風冷機架。
現在,隨着支持高達 300kW 的超高密度和預集成機架的出現——這個數字還在不斷攀升——對先進冷卻技術的需求持續增長。
液體冷卻涉及通過閉環系統循環冷卻液(通常是水或水基溶液)以吸收和散發熱量。水不斷循環,實現零水利用效率 (WUE) 水平。數據中心還可以通過其他液體冷卻技術補充這種方法,以更有效地支持 AI 的快速處理性能要求。
例如,直接芯片冷卻使冷板直接與 GPU 和 CPU 接觸,而浸入式冷卻則涉及將整個服務器組件浸入非導電冷卻液中。存在各種散熱技術,例如液體對液體(閉環系統的一部分)或液體對空氣。通過混合使用這些技術,數據中心可以靈活地最大限度地提高任何類型部署的效率。
此外,冷卻分配單元 (CDU) 支持各種硬件配置,可能需要上遊液體,或者一些可能是獨立的以支持改造解決方案。隨着 AI 部署發展到支持邊緣推理,這些不同的部署架構對於支持非常重要。
使 AI 部署和 ESG 計劃保持一致是可能的
通過超越一刀切的冷卻解決方案,數據中心可以更有效地平衡 AI 部署的技術要求和可持續性優先事項。這種方法提供了靈活性,無論服務器配置如何,都可以冷卻數據中心最熱的區域,從而在整個設施中實現最佳溫度,同時最大限度地提高能源效率。
借助創新的冷卻技術和多方面的方法,數據中心可以繼續提供當今苛刻的 AI 工作負載所需的可靠性和性能,並爲基於 ESG 最佳實踐的廣泛 AI 採用奠定基礎。
作者:Flexential 首席執行官 Chris Downie
標題:數據中心如何同時推動 AI 發展和 ESG 進步
地址:https://www.utechfun.com/post/415383.html