導讀 By Ricky UItra以太網聯盟致力於從物理層、鏈路層、傳輸層和軟件層改進以太網技術。在兼容當前以太網生態系統的前提下,提高以太網的轉發性能,致力於完善以太網通信協議和應用接口。它還改進了存儲...
By Ricky
UItra以太網聯盟致力於從物理層、鏈路層、傳輸層和軟件層改進以太網技術。在兼容當前以太網生態系統的前提下,提高以太網的轉發性能,致力於完善以太網通信協議和應用接口。它還改進了存儲、管理、安全結構和遙測能力,使UItra以太網技術能夠滿足人工智能和高性能計算的網絡需求。
Ultra以太網聯盟將需要重點關注的網絡類型確定爲Type2網絡(後端網絡),並不反對其在Type1網絡(前端網絡)中使用,但不會降低Type2的網絡性能,因爲它需要適應Type1。
UEC工作組
UEC最初成立了物理層、鏈路層、傳輸層、軟件層四個工作組,取得了突出的成果。最近,存儲、管理、兼容性與測試、性能與測試調試工作組已經成立,剛剛开始工作。下圖爲UEC的工作組:
物理層工作組
物理層工作組致力於提高物理性能、減少延遲並改進以太網物理基礎設施的管理。它包括以太網物理層規範、電信號和光信號特性、應用接口和數據結構的开發。其目標是讓基礎更加牢固,並確保以太網能夠滿足人工智能和高性能計算的嚴格要求。目前物理層工作組致力於制定100G/Lane和200G/Lane的PHY(端口物理層)規範,並確定了100G/Lane介質類型以及PHY支持的速率和類型。200G/Lane的規格將在IEEEP802.3djis批准後確定。
物理層工作組引入了鏈路質量預測的幾個新概念:UCR(不可糾正碼字比)、MTBPE(PHY錯誤之間的平均時間)和MTTFPA(錯誤數據包接受的平均時間),致力於更准確地預測和測量物理層鏈路質量。
鏈路層工作組
鏈路層工作組致力於提高鏈路層傳輸的可靠性和效率,提高鏈路層遙測能力。
鏈路層的主要研究方向有:
鏈路層可靠性
在鏈路層添加LLR子層,位於LLC和MACCONTROL子層之間,用於鏈路層端到端錯誤數據包重傳。
基於信用的流量控制
支持鏈路層端到端基於信用的流量控制機制,管理鏈路間幀的無損傳輸。採用CBFC(Credit-BasedFlowControl)機制來替代PFC流控。接收方定期向對方發送緩衝區空間,發送方根據消息優先級和緩衝區大小發送消息。緩衝區空間還可以用於自適應路由選擇。
包速率提升
它致力於以太網報文頭的壓縮,以提高幀傳輸效率。以太網在長期的演進過程中,報文頭不斷膨脹,導致傳輸效率較低。許多領域還沒有使用智能計算網絡。因此,壓縮報文頭、提高幀傳輸效率勢在必行。
報文頭中需要有一個標志來指示消息是壓縮的還是未壓縮的,以便壓縮消息和未壓縮消息在網絡中共存。發送方可以在不影響原有功能的情況下選擇是否壓縮消息。
目前,報文頭壓縮有多種解決方案,正在討論中。
協商
它建立了鏈路層參數和特性的協商方法。鏈路層的一些新功能(例如LLR、CBFC和PRI)需要協商才能支持。主要思想是擴展LLDP並添加UECOUI,用於設備之間新鏈路層功能的協商。
傳輸層工作組
UET(UEC傳輸層)工作組致力於最具挑战性的應用擴展、可靠的消息傳輸、安全的數據傳輸、避免網絡擁塞。其目標是解決RoCE傳輸的不足,提供高效、可靠、安全的大規模傳輸。目標傳輸端點達到256,000個,支持的進程數達到100,000,000個。
UET的主要模塊如下圖所示:
UET包含三個模塊:數據包傳送、安全性和語義。各模塊功能如下:
數據包傳送子層(PDS)
PDS包含可靠性和擁塞管理兩個模塊。
可靠性模塊需要滿足三個關鍵要求:
● 極致的可擴展性
● 消息有序傳輸
● 無序消息傳輸
可靠性模塊設計有四種消息傳輸模式,每種模式都有其特定的用途,以滿足HPC、AI、ML等應用場景。四種消息傳輸模式是:
可靠、有序的交付(ROD)
該模式按順序傳輸消息,適用於需要有序傳輸消息的應用。
可靠、無序的運營交付(RUD)
這種模式只能向語義層傳輸一次消息,但可以容忍網絡中的無序傳遞。可靠傳輸層需要檢測重復的消息,以確保每條消息只能傳輸到語義層一次。
冪等操作的可靠、無序交付(RUDI)
該模式針對RDMA(遠程直接數據存取)的讀寫操作進行了優化。
不可靠、無序交付(UUD)
不可靠消息可以承載UET的許多新語義。UDD的用戶不需要可靠傳輸而使用其他可靠性方法。
擁塞管理模塊還在研究中,包括擁塞管理和負載均衡,可以基於各個FEP進行擁塞管理。其核心是基於接收方信用的流量控制。擁塞控制定義了窗口大小和注入速率。目標是降低速率並限制消息,以避免中間節點和端點的擁塞。路徑負載平衡定義了特定消息選擇的路徑,ECMP(等價路由)可用於選擇路徑。
運輸安全
傳輸安全是UET設計的重中之重,所有數據有效負載和大多數傳輸標頭都可以選擇加密和身份驗證。
語義
● UET語義層提供高性能和高可擴展的操作,實現專業化的人工智能和全功能的HPC部署。
● 語義層是用戶軟件和PDS(消息傳遞層)之間的橋梁。語義層定義了一系列操作,例如發送、接收、寫入、讀取等。該層提供可選的排序,包括各種可選的發起者和目標完成通知能力。
● 語義層提供無連接調用API,必須原生支持*CCL、MPI、OpenSHMEM等API。
軟件層工作組
軟件層通過使用libfabric API作爲數據平面框架,兼容當前廣泛採用的各種通信庫(例如*CCL、MPI和SHMEM),促進了UEC的快速採用。它定義了各種加速器和FEP之間的交互,包括相關的加速器API。它定義了交換機、FEP和聚合管理器(AM)的控制平面和數據平面機制,以允許不同UEC供應商之間的互操作性。它滿足了UEC支持多種工作負載配置文件的需求。
軟件層需要爲INC做的工作包括:
● 使用INC的集合通信(libfabric)定義一個API(使用C語言)。
● 定義一個發現機制來確認可用的INC卸載功能。
● 定義這些庫用於與聚合管理器(AM)通信的RPC接口。指定AM與提供INC資源的UEC交換機之間通信所使用的RPC接口。
● OpenConfig擴展,用於配置網絡設備的FEP(由AM配置),以實現集體通信卸載以及性能和錯誤監控。
● 具有多個功能配置文件的INC兼容網絡設備的行爲。指導UEC傳輸協議的开發,使INC技術可以輕松應用於硬件實現。
標題:UItra以太網聯盟工作組的更新
地址:https://www.utechfun.com/post/306186.html