UItra以太網聯盟工作組的更新

2023-12-20 18:00:48    編輯: robot
導讀 By Ricky UItra以太網聯盟致力於從物理層、鏈路層、傳輸層和軟件層改進以太網技術。在兼容當前以太網生態系統的前提下,提高以太網的轉發性能,致力於完善以太網通信協議和應用接口。它還改進了存儲...

By Ricky

UItra以太網聯盟致力於從物理層、鏈路層、傳輸層和軟件層改進以太網技術。在兼容當前以太網生態系統的前提下,提高以太網的轉發性能,致力於完善以太網通信協議和應用接口。它還改進了存儲、管理、安全結構和遙測能力,使UItra以太網技術能夠滿足人工智能和高性能計算的網絡需求。

Ultra以太網聯盟將需要重點關注的網絡類型確定爲Type2網絡(後端網絡),並不反對其在Type1網絡(前端網絡)中使用,但不會降低Type2的網絡性能,因爲它需要適應Type1。



UEC工作組

UEC最初成立了物理層、鏈路層、傳輸層、軟件層四個工作組,取得了突出的成果。最近,存儲、管理、兼容性與測試、性能與測試調試工作組已經成立,剛剛开始工作。下圖爲UEC的工作組:


物理層工作組

物理層工作組致力於提高物理性能、減少延遲並改進以太網物理基礎設施的管理。它包括以太網物理層規範、電信號和光信號特性、應用接口和數據結構的开發。其目標是讓基礎更加牢固,並確保以太網能夠滿足人工智能和高性能計算的嚴格要求。目前物理層工作組致力於制定100G/Lane和200G/Lane的PHY(端口物理層)規範,並確定了100G/Lane介質類型以及PHY支持的速率和類型。200G/Lane的規格將在IEEEP802.3djis批准後確定。

物理層工作組引入了鏈路質量預測的幾個新概念:UCR(不可糾正碼字比)、MTBPE(PHY錯誤之間的平均時間)和MTTFPA(錯誤數據包接受的平均時間),致力於更准確地預測和測量物理層鏈路質量。

鏈路層工作組

鏈路層工作組致力於提高鏈路層傳輸的可靠性和效率,提高鏈路層遙測能力。

鏈路層的主要研究方向有:


鏈路層可靠性

在鏈路層添加LLR子層,位於LLC和MACCONTROL子層之間,用於鏈路層端到端錯誤數據包重傳。

基於信用的流量控制

支持鏈路層端到端基於信用的流量控制機制,管理鏈路間幀的無損傳輸。採用CBFC(Credit-BasedFlowControl)機制來替代PFC流控。接收方定期向對方發送緩衝區空間,發送方根據消息優先級和緩衝區大小發送消息。緩衝區空間還可以用於自適應路由選擇。


包速率提升

它致力於以太網報文頭的壓縮,以提高幀傳輸效率。以太網在長期的演進過程中,報文頭不斷膨脹,導致傳輸效率較低。許多領域還沒有使用智能計算網絡。因此,壓縮報文頭、提高幀傳輸效率勢在必行。

報文頭中需要有一個標志來指示消息是壓縮的還是未壓縮的,以便壓縮消息和未壓縮消息在網絡中共存。發送方可以在不影響原有功能的情況下選擇是否壓縮消息。

目前,報文頭壓縮有多種解決方案,正在討論中。

協商

它建立了鏈路層參數和特性的協商方法。鏈路層的一些新功能(例如LLR、CBFC和PRI)需要協商才能支持。主要思想是擴展LLDP並添加UECOUI,用於設備之間新鏈路層功能的協商。

傳輸層工作組

UET(UEC傳輸層)工作組致力於最具挑战性的應用擴展、可靠的消息傳輸、安全的數據傳輸、避免網絡擁塞。其目標是解決RoCE傳輸的不足,提供高效、可靠、安全的大規模傳輸。目標傳輸端點達到256,000個,支持的進程數達到100,000,000個。

UET的主要模塊如下圖所示:


UET包含三個模塊:數據包傳送、安全性和語義。各模塊功能如下:


數據包傳送子層(PDS)

PDS包含可靠性和擁塞管理兩個模塊。

可靠性模塊需要滿足三個關鍵要求:

● 極致的可擴展性
● 消息有序傳輸
● 無序消息傳輸

可靠性模塊設計有四種消息傳輸模式,每種模式都有其特定的用途,以滿足HPC、AI、ML等應用場景。四種消息傳輸模式是:

可靠、有序的交付(ROD)

該模式按順序傳輸消息,適用於需要有序傳輸消息的應用。

可靠、無序的運營交付(RUD)

這種模式只能向語義層傳輸一次消息,但可以容忍網絡中的無序傳遞。可靠傳輸層需要檢測重復的消息,以確保每條消息只能傳輸到語義層一次。

冪等操作的可靠、無序交付(RUDI)

該模式針對RDMA(遠程直接數據存取)的讀寫操作進行了優化。

不可靠、無序交付(UUD)

不可靠消息可以承載UET的許多新語義。UDD的用戶不需要可靠傳輸而使用其他可靠性方法。

擁塞管理模塊還在研究中,包括擁塞管理和負載均衡,可以基於各個FEP進行擁塞管理。其核心是基於接收方信用的流量控制。擁塞控制定義了窗口大小和注入速率。目標是降低速率並限制消息,以避免中間節點和端點的擁塞。路徑負載平衡定義了特定消息選擇的路徑,ECMP(等價路由)可用於選擇路徑。

運輸安全

傳輸安全是UET設計的重中之重,所有數據有效負載和大多數傳輸標頭都可以選擇加密和身份驗證。

語義

● UET語義層提供高性能和高可擴展的操作,實現專業化的人工智能和全功能的HPC部署。
● 語義層是用戶軟件和PDS(消息傳遞層)之間的橋梁。語義層定義了一系列操作,例如發送、接收、寫入、讀取等。該層提供可選的排序,包括各種可選的發起者和目標完成通知能力。
● 語義層提供無連接調用API,必須原生支持*CCL、MPI、OpenSHMEM等API。

軟件層工作組

軟件層通過使用libfabric API作爲數據平面框架,兼容當前廣泛採用的各種通信庫(例如*CCL、MPI和SHMEM),促進了UEC的快速採用。它定義了各種加速器和FEP之間的交互,包括相關的加速器API。它定義了交換機、FEP和聚合管理器(AM)的控制平面和數據平面機制,以允許不同UEC供應商之間的互操作性。它滿足了UEC支持多種工作負載配置文件的需求。


軟件層需要爲INC做的工作包括:


● 使用INC的集合通信(libfabric)定義一個API(使用C語言)。
● 定義一個發現機制來確認可用的INC卸載功能。
● 定義這些庫用於與聚合管理器(AM)通信的RPC接口。指定AM與提供INC資源的UEC交換機之間通信所使用的RPC接口。
● OpenConfig擴展,用於配置網絡設備的FEP(由AM配置),以實現集體通信卸載以及性能和錯誤監控。
● 具有多個功能配置文件的INC兼容網絡設備的行爲。指導UEC傳輸協議的开發,使INC技術可以輕松應用於硬件實現。

標題:UItra以太網聯盟工作組的更新

地址:https://www.utechfun.com/post/306186.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡