速度提升數十倍,用光子計算重塑AI算力集群

2024-11-04 18:40:59    編輯: robot
導讀 前言: 要實現超強的AI能力,需要超大規模的模型,要訓練超大規模的AI模型,需要數千,甚至上萬的GPU協同工作。 這就帶來幾個問題:更多的GPU造成的高能耗,計算卡與計算卡之間的通信延遲,計算集群與...

前言:

要實現超強的AI能力,需要超大規模的模型,要訓練超大規模的AI模型,需要數千,甚至上萬的GPU協同工作。

這就帶來幾個問題:更多的GPU造成的高能耗,計算卡與計算卡之間的通信延遲,計算集群與計算集群之間的通信延遲和算力損耗。

那么,如果用光來計算,用光來傳輸,會怎么樣?

作者 | 方文三

圖片來源 |  網 絡 

光子計算初創公司Lightmatter

Lightmatter近日宣布成功融資4億美元,這一巨額資金將用於突破現代數據中心的瓶頸。

Lightmatter作爲一家在光學領域具有創新實力的公司,其研發的光學技術成功應用於AI算力集群,實現了性能的飛躍。

傳統的電子傳輸在數據處理速度上逐漸面臨瓶頸,而Lightmatter的光學技術則利用光子的特性,以光速進行數據傳輸和處理,大大減少了數據傳輸的延遲,從而顯著提高了整個算力集群的運行效率。

這種技術突破並非一蹴而就,是Lightmatter團隊長期投入研發的成果。他們在光學芯片設計、光通信協議等關鍵領域進行了深入研究和創新,克服了諸多技術難題,最終實現了將光學技術與AI算力集群的完美融合。

Lightmatter由Nicholas Harris、Darius Bunandar和Thomas Graham於2017年創立。Nicholas Harris是麻省理工學院量子光子實驗室的成員,2012年,他與合作者實現了“可編程納米光子處理器”(PNP),這是一種基於硅光子學的光學處理器,可以對光進行矩陣變換。

光子計算重塑AI算力集群

Lightmatter有光子計算單元,有光學芯片封裝和傳輸技術,能夠系統化提升整個AI計算集群的計算力,計算效率,並降低功耗。

Lightmatter的光學互連層技術允許數百個GPU同步工作,極大地簡化了AI模型訓練和運行的復雜性和成本。

AI技術的迅猛發展,數據中心行業迎來了前所未有的增長,但並非簡單的增加GPU數量就能解決問題。

高性能計算專家早已指出,如果超級計算機的節點在等待數據輸入時處於空闲狀態,那么節點的速度再快也無濟於事。

互連層是將CPU和GPU架構成一個巨大計算機的關鍵,而Lightmatter通過其自2018年以來开發的光子芯片,構建了目前最快的互連層。

公司CEO兼創始人Nick Harris表示,超大規模計算需要更高效的光子互連技術,而傳統的Cisco交換機無法滿足這一需求。

目前,數據中心行業的頂尖技術是NVLink和NVL72平台,但這些技術在網絡速度和延遲方面仍存在瓶頸。

Lightmatter的光子互連技術通過純光學接口,每根光纖可達到1.6 terabits,顯著提升了數據中心的性能。

創始人Harris指出,光子技術的發展速度遠超預期,經過七年的艱苦研發,Lightmatter已經准備好迎接市場的挑战。

超快計算,超快連接,軟件兼容

Lightmatter的產品分爲光子計算平台(Envise),芯片互連產品( Passage)和適配軟件(Idiom)三部分。

Envise:是世界首個光子計算平台,每個Envise處理器擁有256個RISC內核,提供400Gbps的芯片間互連帶寬,而且支持PCI-E 4.0標准接口,具有不錯的兼容性。

Envise處理器的原理是光通過波導進行計算,而每增加一種顏色的光源,就能相應增加運算速度。

同樣是一個計算核心,當光源種類達到8種,就能提升8倍的計算性能,同時計算效率也達到普通計算核心的2.6倍。當計算核心和光源種類同步提升時,計算性能可以提升數十倍。

Passage:是一種利用光子進行芯片互連的技術,屬於I/O技術的一種。任何超級計算機都由許多小型獨立計算機組成,爲了發揮性能,它們必須不斷相互通信,確保每個核心都知道其他核心的進展,並協調超級計算機設計應對的極其復雜的計算問題。

Lightmatter的技術利用波導(wave guide)而非光纖在一個大的芯片間爲各個不同種類的計算核心互連並傳輸數據,這提供了極高的並行互連帶寬。

Idiom:是一個工作流工具,它可以讓基於Pytorch、TensorFlow或ONNX等框架構建的模型,直接在Envise計算基礎設施上使用。無需更改 Pytorch、TensorFlow或ONNX文件。

此外,它還爲开發者提供一系列方便的工具,例如可以自動虛擬化每個 Envise服務器,在多個Envise服務器之間執行分區,爲多個不同的用戶個性化分配使用的芯片數量。

市場競爭格局

Lightmatter的光子互連技術不僅提升了數據中心的性能,還吸引了包括微軟、亞馬遜、xAI和OpenAI在內的衆多大型數據中心公司的關注。

此次4億美元的D輪融資使Lightmatter的估值達到44億美元,成爲光子計算領域的領軍企業。

但專注於光子計算的公司,不止Lightmatter一家,Celestial AI也在今年3月獲得了1.75億美元的C輪融資,它主要利用光在芯片內部和芯片之間進行數據移動,與Lightmatter的Passage類似。

中國市場上也有不少在光子計算領域耕耘的公司,只是它們的發展規模相對較小。

目前,中國市場的AI算力硬件公司們,其實面臨着彎道超車的機會。這個局面有些像中國的新能源汽車行業,不在舊有的體系架構上追趕國外巨頭,而用新技術去滿足新需求,建立自己的優勢。

一方面AI計算是一個相對較新的領域,海外的公司有領先,但是並沒有構建很難逾越的壁壘,另一方面AI是專有計算,有不少开源的計算架構適合AI。

中國公司只要能研發出一些自有的IP,再利用本身就具有的強工程能力,就很有可能开發出至少不遜於海外的算力硬件。

結尾:

未來,Lightmatter不僅將繼續優化互連技術,還將开發新的芯片基板,進一步提升光子計算的性能。Harris預測,未來十年,互連技術將成爲摩爾定律的核心。

內容來源於:阿爾法公社:用光學讓AI算力集群提速數十倍,Lightmatter融資4億美元|AlphaFounders;安特恩:光子計算新紀元:Lightmatter融資4億美元,引領AI數據中心革命

       原文標題 : AI芯天下丨趨勢丨速度提升數十倍,用光子計算重塑AI算力集群



標題:速度提升數十倍,用光子計算重塑AI算力集群

地址:https://www.utechfun.com/post/441294.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡