導讀 托管數據中心的標准結構是擁有數十個甚至數百個客戶同時運行不同的應用。但英偉達提供了對一種新型數據中心的洞察,該數據中心運行的應用,而且只有一個客戶在使用它。 “人工智能工廠”的出現 這是一種新型的數...
托管數據中心的標准結構是擁有數十個甚至數百個客戶同時運行不同的應用。但英偉達提供了對一種新型數據中心的洞察,該數據中心運行的應用,而且只有一個客戶在使用它。
“人工智能工廠”的出現
這是一種新型的數據中心,這種新型的數據中心與過去的數據中心不同,過去的數據中心有很多應用運行,由很多不同的租戶使用相同的基礎設施”。
這些新的數據中心托管很少的應用,基本上由一個租戶使用,它處理數據,訓練模型,然後生成令牌並生成人工智能。我們將這些新數據中心稱爲“人工智能工廠”。
我們看到人工智能工廠隨處可見。我的猜測是,幾乎每個主要地區都會有,每個主要國家肯定都會有自己的人工智能雲。因此,我們正處於這種拐點、這種計算轉型的开始。
這種趨勢目前正在印度、瑞典、日本和法國發生。人工智能要想真正有效,就必須符合語言和文化標准。日本的人工智能需求與瑞典的需求不同。這就是爲什么人工智能數據中心和單租戶人工智能工廠僅限於個別國家。
評估部署人工智能的規模
Amazon和Google等大型雲服務提供商以及Equinix等主要主機托管提供商的數據中心往往非常龐大,有一個足球場那么大。考慮到NvidiaHopper處理器的巨大功耗,這些人工智能工廠的規模將與麥當勞相當。
典型的數據中心機架功率預算在6kW至8kW範圍內,但如果希望部署針對運行LLM而優化的服務器,則單個服務器消耗約11KW的功率,這相當於大約14台通用服務器的平均功耗。
在這種情況下,在典型的數據中心中只能運行有限數量的GPU服務器,例如DGXH100,如果你有一個1MW的數據中心,可以在裏面部署大約50台DGXH100服務器。要將人工智能大規模部署到大量並發用戶,將需要大型此類服務器集群。這意味着典型的數據中心只能滿足有限數量的客戶的需求,而且很可能只能滿足單個客戶的需求。
人工智能工廠的未來
對於人工智能工廠等單一用途GPU環境來說,最具成本效益的設計將是專門爲更高密度和液體冷卻而設計的專用數據中心,並且位置最適合人工智能企業。
人工智能集群的功耗將成爲數據中心擁有大量服務器的限制因素,而且其中一些數據中心很可能專門用於人工智能。圍繞人工智能的安全和監管框架也可能推動這一趨勢。生成式人工智能和通用人工智能的發展引發了一些安全和合規性問題,因此企業可能會決定從高度安全的專用設施運行此類工作負載。
人工智能工廠與數據中心
由於人工智能功率密度是傳統數據中心的五到十倍,人工智能工廠的規模不會達到傳統數據中心的大小,傳統數據中心的面積已超過一百萬平方英尺。
傳統數據中心和人工智能工廠之間的另一個區別是它們的位置。巨型數據中心往往建在可再生能源旁邊的偏遠地區,而人工智能工廠則可以建在市中心或大城市地區以及擁有大量可用電力的現有設施中。
目前,有大量辦公和零售空間未得到充分利用,變得非常非常有吸引力的是一座廢棄的建築或未充分利用的城市空間,或者是一個偏僻的舊倉庫的一部分,它們已經擁有電力,可以在其中放下一些人工智能設備,一些液體冷卻並插入電源去。
盡管無法預測數據中心行業的未來,但人工智能的快速增長暗示,隨着數字基礎設施運營商爭先恐後地滿足不斷增長的需求,人工智能工廠可能很快就會成爲必需品。
標題:單租戶人工智能工廠會成爲最新的數據中心趨勢嗎?
地址:https://www.utechfun.com/post/340904.html