人工智能如何使數據中心更高效和脫碳

2024-06-19 18:01:11    編輯: robot
導讀 據估計,數據中心和其他雲計算業務目前佔全球用電量的 1%。運行這些大型服務器群(尤其是冷卻服務器群)所消耗的碳排放量絕非微不足道。據認爲,約 50% 的用電量與基本運營成本有關,而高達 40% 的用...


據估計,數據中心和其他雲計算業務目前佔全球用電量的 1%。運行這些大型服務器群(尤其是冷卻服務器群)所消耗的碳排放量絕非微不足道。據認爲,約 50% 的用電量與基本運營成本有關,而高達 40% 的用電量與冷卻成本有關。

數據中心正在四處尋找解決方案,從利用更多可再生能源到將數據中心置於海底以節省冷卻成本。

一些最節省和實用的解決方案涉及實施人工智能來定位和糾正效率低下的問題。Gartner的一份報告估計,未來兩年,人工智能將在一半的數據中心投入使用。IDC 2019年的一份報告顯示,這種情況可能已經發生。工作量將同比增長20%,因此這是一個緊迫的問題。

Hitachi Vantara 數據平台產品營銷總監 Ian Clatworthy 和 DataBank 工程副總裁 Eric Swartz 談到了數據中心人工智能解決方案的可能性和局限性。

收集適當的數據

爲了創建和校准有用的 AI 儀器,數據中心必須收集和輸入適當的數據。事實證明,這很有挑战性,因爲某些類型的數據在日常運營中過去沒有用處,因此被忽略了。有些數據可能被收集但未被使用。有些數據根本沒有被收集,這意味着操作員必須從頭开始或從現有數據中推斷。

必要的硬件數據包括:可用存儲空間、訪問便利性、特定時間運行的機器數量以及在任何特定情況下流量被導向的機器。與機器供電和冷卻所消耗的能量相關的數據也是必不可少的,與中心內外環境條件相關的數據也是必不可少的。

“爲了能夠構建一個合適的機器學習人工智能系統,你需要所有這些來真正提高效率。所有這些都很重要,”Swartz 說。“每一個數據點都可能相互影響。”

事實上,人工智能在收集這些信息方面是有用的。在得到正確的指令後,數據挖掘可以提取隱藏在看似不相關的統計數據中的有用數據。根據 Clatworthy 的說法,當正確的數據排列好後,它可以“以一種有意義的方式呈現信息”。

如何利用人工智能提高效率

服務器的用電量是人工智能幹預的主要目標。未使用的服務器處於運行狀態,傳入流量在可用設備之間分配效率低下。調度控制引擎可以使用深度學習來適當引導流量。它可以以最佳方式分布在可用的機器上,以充分利用其功能,但不會使其過載。

然後,可以關閉未使用的機器,直到需要它們爲止。更好的是,Clatworthy 說,“我們可以關閉 CPU。通過關閉,你可以減少電力消耗。”他認爲,打开和關閉機器的電源也是低效的。

可以預測流量模式,從而更節約地使用設備。因此,電源使用效率 (PUE) 得到改善。隨着工作負載的增加,人工智能可以幫助擴展這些流程。

通過預測性維護可以提高效率。“通過了解組件問題或維護計劃的歷史數據,並將其與預算分配聯系起來,組織可以使用人工智能來提供預測模型,”Clatworthy 說。

通過利用數據確定何時可能發生停電,可以更輕松地建立適當的備份。修補和升級既繁重又費力,但也可以在一定程度上實現自動化。故障機器可以在造成服務中斷之前進行更換或維修。

電源管理本身也可以從人工智能中受益。通過確定可再生能源何時最可用(風力發電在刮風的日子,太陽能發電在晴天),數據中心可以確定何時從這些能源獲取電力,何時轉向不太理想的化石燃料電力。廢熱可以重新定向,在數據中心內部或周圍設施內使用。

“你不能總是使用可再生能源,”Swartz 聲稱。“通過使用人工智能來確定何時是使用它的最佳時間,你可以兩全其美。”

這也可以節省成本。“即使 1% [的用電量] 也可能意味着數十萬美元的能源,”他補充道。“將其調到最有效的運行參數將非常有益。”

冷卻系統是人工智能效率計劃的另一個目標。與電力一樣,它們在過去也是恆定的。也就是說,它們不會根據不斷變化的參數進行調整,而是以模糊的需求估計確定的穩定速率運行。

冷卻非常昂貴——無論是在財務上還是在碳排放方面——即使對冷卻系統進行微小的調整也可以節省大量成本。熱管理必須考慮環境溫度、天氣、任何給定時間運行機器產生的熱量、建築物建造的材料以及現有的 HVAC 系統等因素。

人工智能可以將冷卻活動引導到需要它的系統——直到特定的機器機架——並在不需要它的區域關閉它們。它甚至可以考慮滯後時間,預測某些區域何時恢復供電並提前將冷卻引導到它們。

數字孿生如何優化數據中心系統

創建數字孿生或數據中心物理環境的虛擬表示有助於模擬其各個組件如何相互作用,而不會對系統本身造成中斷風險。通過輸入有關能源、溫度、交通需求和天氣等因素的數據,AI 架構師可以爲數據中心設計最佳條件——至少在理論上是這樣。

“我們可以模擬不同的冷卻配置,”Clatworthy 舉例說。“無論是在新加坡、墨爾本、歐洲還是在雨中——我們都可以根據設備的位置確定最有效的冷卻布局。”

缺失數據——總是有缺失數據——當然會扭曲這些數字模型。但即使是合理數量的歷史數據也可以創建數據中心實際運行和使用能源的現實模型。

然而,數字孿生並不是自我維持的。它們需要人類觀察員的調整,他們可以標記超出物理世界中可能出現的參數。因此,模型會隨着時間的推移而完善。

數據中心部署 AI 面臨的挑战

數據稀缺是數據中心實施 AI 面臨的最棘手的挑战。雖然有些數據是爲了其他目的而收集的,因此可以輸入到 AI 系統中,但一些對優化 AI 性能至關重要的數據迄今爲止一直漂浮在數字以太中。有些數據可以從其他來源追溯收集。但其他類型的數據需要新的方法——這意味着沒有歷史記錄。數據中心必須從頭开始。

例如,數據中心可以使用制造商指定的开箱即用機器的功耗。但隨着機器老化和性能下降,機器的功耗可能無法收集——因此無法用於 AI 解決方案。對正在使用的每台設備的功能和漏洞的深入了解是必不可少的——而且通常很難獲得。

正如 Swartz 所指出的,多租戶數據中心在收集數據方面面臨着另一個困難,因爲他們必須遵守與客戶達成的隱私協議。“我們有不同類型的客戶,他們有不同的需求和不同的風險水平,”他表示。 “當你試圖適應所有這些時,你通常無法成爲生活在邊緣的人。”

人工智能還需要新的復雜系統和設備來支持其實施——即所謂的人工智能稅。雖然前期成本不低,但後期成本節省似乎是可靠的。盡管如此,啓動和運行系統並非易事——必須收集、處理、輸入數據,然後重新分析。

確保數據中心能夠以可持續的方式相互通信是另一個挑战。“我們正在研究如何使用人工智能軟件將數據從數據中心轉移,而不會對客戶產生任何影響,”Clatworthy 說。當考慮到可再生能源時,這會帶來許多障礙。“太陽在這裏落山了。這意味着我們不會使用可再生能源來移動這個數據集。”

即使人工智能系統越來越復雜,並且它們能夠做出這樣的決定,但在某些情況下,它們仍然無法與人類推理相提並論。

“人工智能還沒有能力及時做出復雜的战略決策,”Clatworthy 觀察到。“我希望它告訴我我的長期能力會是多少,告訴我需要升級什么。我將讓我的團隊專注於不可預見的異常情況。”

隨着人工智能在數據中心運營中變得越來越不可或缺,其人工處理人員必須相應地調整其職責。

作者:Richard Pallardy



標題:人工智能如何使數據中心更高效和脫碳

地址:https://www.utechfun.com/post/386135.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡