由 GenAI 推動的人工智能 (AI) 的興起正在重塑數據中心的格局,將其推向新的領域,而這些領域需要的不僅僅是漸進式升級。
據分析師 Gartner 稱,預計到 2024 年,數據中心系統的支出將增長 24%,這主要是由於 GenAI 的規劃增加。隨着人工智能成爲業務運營不可或缺的一部分,數據中心必須從傳統設計中發展出來,以適應這項技術的獨特要求。現在的挑战是從頭开始重新思考基礎設施的設計和運營,讓數據中心准備好處理今天的人工智能工作負載和明天的快速發展。
從傳統基礎設施向人工智能優化基礎設施的轉變
傳統數據中心的設計考慮了通用計算。它們的基礎設施通常圍繞標准服務器、存儲和網絡組件構建,這些組件適用於傳統工作負載。然而,人工智能需要完全不同的東西。人工智能模型(尤其是機器學習和深度學習中使用的模型)的計算強度需要一種能夠支持大規模並行處理能力的新型高性能計算 (HPC) 環境。
爲了支持 AI,IT 供應商正在改進其硬件方法。這包括集成更強大的圖形處理單元 (GPU)、張量處理單元 (TPU) 和其他專爲 AI 工作負載設計的專用加速器。
但這不僅僅是添加更強大的機器;而是要重新架構整個數據中心,以使這些系統能夠充分發揮其潛力。這意味着重新評估從機架密度到布线、冷卻介質和配電布局的一切,以實現最佳性能和效率。
重新定義 AI 工作負載的冷卻策略
AI 帶來的最直接挑战之一是熱量輸出的大幅增加。裝有 GPU 和其他加速器的高密度機架產生的熱量遠高於傳統服務器機架,因此必須徹底重新考慮冷卻策略。
盡管傳統的空氣冷卻方法絕不是多余的,但它們對於 AI 工作負載來說可能不夠。這促使數據中心探索液體冷卻等先進解決方案,這些解決方案可以更有效地處理更高的熱負荷並與空氣冷卻配合使用。據行業分析師 Dell’Oro Group 稱,未來五年,液體冷卻市場規模可能增長到 150 億美元以上。
無論是通過直接到芯片還是浸入式冷卻,液體冷卻都提供了一種有前途的解決方案,可以更有效地將熱量從硬件中轉移出去。這不僅使數據中心能夠保持更高的密度,而且還減少了冷卻所需的總能量。此外,這些系統通常可以與熱量再利用策略集成,其中多余的熱量被捕獲並重新用於其他應用,從而提高整體能源效率和可持續性。
這些冷卻技術的採用代表着數據中心設計和運營方式的重大轉變。它不僅需要新設備,還需要思維方式的轉變,因爲 IT 運營商現在必須從一开始就考慮 AI 部署的熱影響。
這種轉變需要數據中心設計師、硬件制造商和 AI 解決方案提供商之間的密切合作,以使基礎設施的各個方面都能協調一致,以實現最佳性能。
推動人工智能革命:管理能源需求
衆所周知,人工智能工作負載的能源消耗量很大。訓練深度學習模型或運行復雜模擬所需的計算能力很容易超過傳統數據中心的可用電力。這導致對更節能的硬件和能源管理解決方案的需求激增,這些解決方案可以控制成本和環境影響。
管理這些需求的一種方法是使用人工智能本身來優化能源使用。可以採用機器學習算法來動態管理功耗,並實時調整冷卻和配電以滿足工作負載的需求。這可以顯著節省能源成本,並最大限度地減少數據中心的整體碳足跡。
此外,太陽能或風能等可再生能源的整合變得越來越重要。隨着企業和監管機構推動更環保的運營,能夠利用替代能源的數據中心將更有能力滿足這些期望。這裏的挑战在於平衡可再生能源的間歇性與人工智能工作負載的高需求——這個問題可以通過創新的能源存儲和電網管理解決方案來克服,以提供電網交互和平衡服務。
面向未來的數據中心
隨着人工智能技術的不斷發展,數據中心的設計必須着眼於未來的擴展和靈活性。今天的尖端解決方案可能會成爲明天的瓶頸,因此在構建時考慮可擴展性至關重要。這意味着投資可擴展的設計,以便隨着新技術的出現而輕松升級或擴展。
一種有前途的方法是使用預制模塊化數據中心,這些數據中心可以快速部署和配置以滿足特定需求。可以根據需要添加或重新配置這些單元,允許運營商根據需求進行擴展。這種靈活性在支持 AI 應用程序方面尤其有價值,因爲根據用例的不同,AI 應用程序的要求可能會有很大差異。
數據中心還需要具有適應性——不僅在容量方面,而且在支持各種 AI 工作負載的能力方面。這可能意味着結合 HPC 集群、邊緣計算資源和雲集成來處理 AI 管道的不同方面,從數據提取和預處理到模型訓練和推理。
AI 就緒數據中心的整體方法
最終,爲 AI 時代改造數據中心不僅僅是升級單個組件——而是採用一種重新思考整個生態系統的整體方法。這包括多個利益相關者之間的合作,從硬件制造商和軟件开發商到數據中心運營商和能源供應商。
這一轉變的關鍵在於愿意接受新技術和新方法,並着眼於可持續性和效率。人工智能發展的快速步伐意味着數據中心必須靈活且具有前瞻性,隨時准備適應新的挑战和機遇。
最終,在人工智能時代取得成功的數據中心將是那些在建立時清楚了解人工智能的獨特需求,並致力於創新和可持續發展的數據中心。通過重新設計基礎設施以支持下一代智能應用,它們不僅可以滿足當今的需求,還可以爲未來的智能技術奠定基礎。
作者:Alex Brew , Vertiv 北歐地區總監
標題:人工智能的新需求:爲更智能的未來重新設計數據中心
地址:https://www.utechfun.com/post/445975.html