爲什么服務器冷卻在數據中心行業如此重要?

2024-08-14 18:00:51    編輯: robot
導讀 作者:James Lupton 是 Blackcore Technologies 的首席技術官 數據中心運營商越來越多地尋求新的冷卻解決方案,以確保其服務器有效高效地運行。高性能計算 (HPC) 或...


作者:James Lupton 是 Blackcore Technologies 的首席技術官

數據中心運營商越來越多地尋求新的冷卻解決方案,以確保其服務器有效高效地運行。

高性能計算 (HPC) 或人工智能 (AI) 工作負載可能需要數天的高利用率運行時間才能完成一組復雜的模擬。運行這些工作負載的硬件缺乏足夠的冷卻會導致不可靠、故障並降低服務器系統的整體性能,這也會延長工作負載的運行時間。這意味着運行該工作負載的總成本或服務器在其使用壽命期間運行的總成本將增加。

需要非傳統冷卻的另一個例子是在超頻期間。通過超頻處理器,您可以提高時鐘速度,從而使 CPU 每秒執行更多指令。這通常用於遊戲系統,但現在也廣泛用於需要快速、低延遲計算的領域,如電子交易。

超頻可以提高計算機組件的性能,但代價是增加功率,從而產生額外的廢熱。如果沒有適當的冷卻,組件根本無法應對額外的熱量並發生故障,可能導致提升的性能毫無用處。

爲了解決這些挑战,液體冷卻通常是答案。

數據中心液體冷卻有哪些不同類型?

最常見的三種液體冷卻類型是浸入式冷卻、機架級液體冷卻和獨立式液體冷卻。

浸入式冷卻涉及將所有計算機組件放置在專門的非導電液體中,通常具有油性。浸入式冷卻有兩種類型:單相和雙相。

  • 單相的工作原理是主動將液體泵送到熱源上,吸收熱量,然後將液體循環到熱交換器再次冷卻。
  • 雙相的工作原理是液體保持低沸點。然後,來自組件的熱量在接觸時使液體沸騰,這種相變將熱量從冷的組件上轉移出去。氣泡上升到罐頂,然後凝結回液體形式。冷凝過程會帶走冷卻劑中的熱量。
浸入式冷卻需要定制硬件、非典型機架空間和數據中心定制。它還需要定義一個完整的堆棧,並且維護期望很少,因爲在系統部署後添加卡或磁盤驅動器需要大量工作。與其他方法相比,浸入式冷卻的部署成本通常很高。

然而,與傳統的基於風扇的系統相比,浸入式冷卻的優勢在於它提供了更高的散熱效率。液體冷卻劑的導體比空氣好得多,並且循環所需的能量輸入更少。

機架級液體冷卻是將整個數據中心機架轉變爲廣泛的液體冷卻回路的過程。機架的很大一部分將專用於泵送和冷卻液體冷卻劑。機架的其余部分將採用服務器系統,這些服務器系統的主要發熱組件(CPU,RAM)裝有水塊或冷板,冷卻劑從其上方流過。然後,這些系統將管道引導到機箱後部,在那裏它們有快速斷开閥。

這允許服務器的內部冷卻回路與主機架級冷卻回路連接和斷开。機架級液體冷卻提供非常高密度的計算,因爲您可以將大量硬件堆疊在一起,因爲冷卻基礎設施在某種程度上被抽象化了。然而,這需要整個機架級解決方案,並且根據部署的復雜性,可能會比典型的服務器部署成本大幅增加。

最後,獨立式液體冷卻涉及將所有必要的液體冷卻硬件完全整合到單個服務器機箱中。這意味着將液體冷卻劑泵入特定的計算機組件(即處理器)上,通過水塊或冷板傳遞熱量。這種冷卻劑通過管道輸送到關鍵組件或熱源上,然後像傳統服務器配置一樣返回到由內部風扇冷卻的散熱器。

獨立式液體冷卻意味着數據中心不需要額外的硬件或基礎設施。可以使用傳統機架,服務器基本上像典型的風冷服務器一樣即插即用,這意味着服務器具有與標准服務器類似的維護能力。與浸沒式冷卻系統相比,獨立式液體冷卻的部署成本往往更接近典型服務器的成本。

液體冷卻不僅僅是提高服務器的效率

數據中心所有者意識到,他們可以通過捕獲和回收現有基礎設施中的廢能來提高效率。正在實施一項新的 ISO 能源再利用因子 (ERF) 標准,以幫助數據中心衡量其在能源再利用方面的表現並提高可持續性。

微軟和谷歌都已开始在芬蘭开展熱能再利用項目,前者與 Fortum 合作,稱“數據中心產生的廢熱將轉化爲區域供熱,爲芬蘭第二大城市埃斯波、鄰近的考尼艾寧和基爾科努米市提供服務,這將是迄今爲止世界上最大的數據中心廢熱回收項目。”

與此同時,谷歌正與 Haminan Energia 合作,重新利用現有數據中心的熱量,這將“佔當地區域供熱網絡年熱量需求的 80%”。

英國也在試驗類似的計劃,能源供應商 Octopus 最近向 Deep Green 投資 2 億英鎊,利用廢棄的直流電爲附近的遊泳池供暖。

數據中心的主要制約因素

特別是在金融等行業,人們逐漸遠離雲端,這通常是基於成本的舉措,而回歸到更靠近交易所或由交易所托管的共置數據中心——這是從性能和控制的角度推動的。與任何技術一樣,它都是關於“合適的工具用於合適的工作”。雲和遠程數據中心對於某些行業和項目來說效果很好,但始終需要物理上靠近特定位置的高性能硬件。

人工智能、監管壓力和工作負載將如何影響液冷採用的速度

人工智能和其他 HPC 行業正在繼續提高機架式服務器系統的功率密度。計算機數量的增加意味着功耗增加,從而導致發熱量增加。從服務器系統中去除這些熱量反過來需要爲高 CFM(立方英尺/分鐘)風扇提供更多功率。

液冷技術(包括機架級冷卻和浸沒式)可以提高服務器系統散熱效率,從而減少風扇功率。反過來,這可以減少服務器機架的總體功率預算。

當將此推算到數據中心佔地面積的大部分時,節省的資金可以大幅增加。當您考慮到一些最新的 Nvidia 機架產品需要 40KW 或更高功率時,您可以开始看到功率需求如何轉向極端。作爲參考,許多電子交易共置僅提供 6-12KW 機架的情況並不少見,這些機架有時半空運行,因爲服務器需要的功率超過機架可以提供的功率。

這些趨勢將迫使數據中心採用任何可以減輕其自身基礎設施和爲其供電的本地基礎設施的電力負擔的技術。

此外,任何提高效率的方法,無論是通過減少總體負荷還是重復使用廢熱,對於保持運營效率,同時擴展以滿足不斷增長的計算需求都至關重要。許多人可能會开始考慮構建新的定制 HPC 或以 AI 爲重點的數據中心,從頭开始關注這些新要求。

位置也將繼續在新數據中心建設中發揮重要作用,因爲獲取綠色能源和良好的氣候將成爲需要考慮的新的關鍵因素。

標題:爲什么服務器冷卻在數據中心行業如此重要?

地址:https://www.utechfun.com/post/409638.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡