Infiniband適配器綜合指南

2024-07-09 18:00:17    編輯: robot
導讀 By fibermall 在這個信息驅動的時代,對快速可靠的數據傳輸解決方案的需求從未如此高漲。這本全面的手冊重點介紹高性能的InfiniBand適配器解決方案。它們的制造方式可以滿足當代數據中心、...

By fibermall

在這個信息驅動的時代,對快速可靠的數據傳輸解決方案的需求從未如此高漲。這本全面的手冊重點介紹高性能的InfiniBand適配器解決方案。它們的制造方式可以滿足當代數據中心、高性能計算(HPC)環境和企業網絡的嚴格要求。

事實上,這些適配器憑借其先進的技術提供了快速的數據傳輸速率;它們還具有較低的延遲時間和出色的可擴展性。在本文中,我們將研究一些領先的Infiniband適配器的技術規格、性能指標和基本功能,以便在優化數據傳輸基礎設施時做出明智的決定。


InfiniBand適配器到底是什么?

了解InfiniBand技術


在高性能計算和數據中心中,InfiniBand技術是一種常用的高速通信協議。它提供比傳統網絡協議更好的帶寬以及更低的延遲,非常適合需要快速數據傳輸速率的應用。該協議利用交換結構拓撲,從而允許以非常有效的方式連接多個設備;最大限度地減少擁塞,同時最大限度地提高吞吐量。因此,在這方面,InfiniBand適配器充當該技術所需硬件之間的中介,以實現最佳性能和可靠性。

InfiniBand適配器在數據中心中的作用


數據中心離不开無限帶寬適配器,它是確保服務器、存儲系統和網絡設備之間,高速無縫信息流所必需的重要組件的一部分。這是通過利用無限帶寬的低延遲和高帶寬功能來實現的,從而促進它們之間快速有效的通信。借助這些適配器,數據密集型應用(如大數據分析、人工智能或科學模擬)可以毫無性能瓶頸地運行。除此之外,它們還具有可擴展性,因此允許服務提供商擴展基礎設施,而不會幹擾其設施內的網絡性能。

InfiniBand適配器與以太網網卡


在將infiniband適配器與以太網卡進行比較時,存在一些技術差異。首先,在帶寬和延遲性能指標方面,infiniband比其同類產品具有更高的值。例如,使用這種類型的適配器可以實現數據傳輸速率達到200Gbps,延遲低至100納秒;因此,它適合用於高性能計算(HPC)。相反,盡管以太網由於其實施簡單而被廣泛應用於不同平台,但與具有高級功能的100千兆以太網相比,它仍然提供較低的帶寬和較高的延遲。

另一個區別因素在於這兩種技術之間的通信協議和拓撲。Infiniband採用的交換結構拓撲爲數據傳輸創建了許多並行路徑,從而減少了網絡擁塞。由於這一特性,即使在流量負載較大的情況下,以太網中使用的樹形拓撲也很容易擁塞。此外,Infiniband在所有設備上都原生支持RDMA,從而通過繞過CPU優化數據傳輸,從而降低延遲;使用iWARP或RoCE等協議,在以太網上啓用RDMA可能無法實現這種優化,因爲它們需要額外的配置,並且不能提供類似的性能水平。

是否使用InfiniBand適配器或以太網網卡的決定應基於特定的應用要求,當需要超低延遲和最大吞吐量時,Infiniband變得更可取。

如何選擇適合的Infiniband適配器?

各種Infiniband適配器


SDR或單倍數據速率、DDR或雙倍數據速率、QDR或四倍數據速率、FDR或十四倍數據速率、EDR或增強數據速率和HDR或高數據速率是Infiniband適配器的不同類型,它們爲網絡適配器配置提供了多種選項。SDR提供每通道高達2.5Gbps的速度;DDR將其翻倍至每通道5Gbps。QDR的速度甚至更高,每通道速率爲10Gbps。FDR可實現14Gbps的有效最大值,而EDR則將其翻倍(每通道25Gbps)。最新的HDR適配器通過每個通道每秒提供高達50Gbps的速度!性能要求和預算是選擇Infiniband適配器的主要因素,但請記住,更昂貴的適配器在較低的延遲下提供更高的吞吐量。

Infiniband適配器的關鍵特性


在選擇這些設備中的任何一個時,都必須考慮幾個特性,這樣不僅可以從它們中獲得最大輸出,而且還要確保它們與組成計算機系統的其他組件協同工作,這些東西最常被世界各地的人們使用,這取決於每個人對機器的需求。這些包括帶寬,更高的數據速率,如EDR(25Gbps/通道)和HDR(50Gbps/通道),更適合超高性能應用;低延遲應該被考慮,特別是在處理需要非常快響應時間的實時進程時;RDMA支持——特別要注意那些具有RDMA功能的InfiniBand,因爲此功能有助於減少通過局域網傳輸大文件時的CPU過載,從而大大提高這種情況下的整體效率。

還要確保它與您當前的硬件兼容,並具有良好的制造商支持和頻繁的固件更新。端口數量以及電纜管理功能也不容忽視,特別是在密集的網絡環境中工作時,需要在有限的空間內進行許多連接,因此需要正確組織連接這些彼此靠近的不同設備的電纜。最後,考慮成本與可用資源,以便人們不會最終在某些東西上花費超過他們能承受的金額,而這些東西不一定能增加比更便宜的選擇所能提供的價值更多的價值。

單端口與雙端口適配器:比較


性能、冗余和成本是比較單端口和雙端口無限帶寬適配器的主要因素。單端口適配器價格較低,可能足以滿足小型項目的需求,因爲高數據吞吐率並不重要。它們消耗更少的電量,佔用更少的物理空間,因此非常適合注重預算的應用程序。但是,雙端口適配器通過聚合帶寬提供更好的性能,從而支持要求更高的應用,同時還提供故障轉移功能,這樣當一個鏈路發生故障時,另一個鏈路將接管並保持連接,從而減少停機時間並提高可靠性,但與單端口適配器相比成本更高。因此,請根據網絡需求、所需的性能水平和預算限制進行選擇。

市場上有哪些最好的Infiniband適配器?

首選:NVIDIAMellanoxConnectX-6VPI


NVIDIAMellanoxConnectX-6VPI適配器具有高性能、冗余性和成本效益。它們支持單端口和雙端口配置,因此足夠靈活,可以滿足不同的網絡需求。憑借高達200Gb/s的帶寬,它們可以有效處理要求嚴格的應用。除了此功能之外,這些適配器還具有其他增強功能,例如基於硬件的I/O虛擬化和擁塞控制等,這些功能爲保護傳輸中或靜止的數據提供了強大的安全措施。經過測試的與各種硬件的兼容性和頻繁的固件更新保證了它們的長期可用性。相對於其先進的功能,它們價格合理,適合各種實施。

最佳預算選擇:ConnectX-5適配器


ConnectX-5適配器以其價格提供極快的速度,使其成爲預算有限項目的最佳選擇。它支持高達100Gb/s的單端口和雙端口配置,爲各種應用提供足夠的帶寬。此適配器具有高級網絡功能虛擬化(NFV)支持、更好的數據包速度和高效的數據路由等功能,從而保證在其整個使用壽命期間(無論適用與否)都具有可靠的性能。除此之外,它還兼容大多數主流操作系統和硬件平台,同時以低功耗運行,因此也節省能源,從而使該設備非常靈活,可以滿足不同的網絡需求。

高端性能:雙端口QSFP56適配器


雙端口QSFP56適配器提供無與倫比的功能,每個端口高達200Gb/s,對於任何涉及大數據量處理或在盡可能短的時間內將大文件從一個點傳輸到另一個點的項目工作負載,高端性能都是必需的,應使用能夠足夠快地傳輸如此大量信息的適配器來完成,而不會因爲執行這些任務的計算機之間的連接速度不足而出現延遲,以便用戶能夠按時完成任務而無需等待很長時間。

這些類型也適用於現有網絡,因爲它們的設計方式使其可以無縫融入其中而不會造成任何形式的中斷。此外,這些設備還支持高級網絡功能,例如RDMA(遠程直接內存訪問),以及低延遲,可確保在需要時實現更快的數據處理速率。此外,它們具有比同類產品更多的安全功能,並且經過優化,因此使其成爲理想的選擇,尤其是在高需求環境中需要尖端技術解決方案的情況下。

安裝和配置Infiniband適配器的過程是什么?

安裝程序


拆箱並檢查適配器:

小心地從包裝中取出Infiniband適配器,確保您已收到所有組件(包括文檔)。檢查卡的物理狀況是否有損壞。

關閉和打开系統:

按照適當的安全步驟關閉您的PC/服務器。斷开所有電纜並打开機箱,以便訪問PCIe插槽。

插入Infiniband適配器:

在主板上找到一個空的PCIe插槽;將卡輕輕插入其中。使用主板提供的螺釘或閂鎖裝置將卡牢固固定。

重新連接並啓動系統:

關閉系統外殼,重新連接所有電纜,然後打开電源。

安裝驅動程序和軟件:

啓動系統後,安裝此特定InfiniBand適配器制造商提供的必要驅動程序/軟件。通常,需要從制造商網站下載最新驅動程序,並按照其中提供的安裝說明進行操作。

配置支持100GbE的網絡適配器的網絡設置


訪問OS網絡設置,根據需要設置Infiniband適配器。分配IP地址以及其他附加設置(如果有)。

檢查主機總线適配器(HBA)是否已成功安裝(InfiniBand):

要驗證主機總线適配器(HBA)是否已正確安裝,請按照以下步驟操作:首先測試您的網絡適配器以檢查其是否正常運行。然後,確保通過此端口連接的兩個設備之間的連接狀態顯示“鏈接正常”。最後,可以進行所需的速度/連接測試。

調整/調節設置:

爲了獲得更好的性能,可能需要根據特定需求/偏好/條件調整不同的參數,例如RDMA啓用數據包節奏調整等。

解決一般問題


適配器無法識別:

● 首先,您必須檢查適配器是否正確安裝到PCIe插槽中。
● 確保安裝最新的驅動程序非常重要。
● 另外,留意可能需要調整的任何BIOS設置。

無網絡連接:

● 確保網线連接正確。
● 檢查IP地址以及網絡設置是否配置正確。
● 重新啓動系統和網絡交換機。

網絡性能緩慢:

● 您必須驗證RDMA啓用設置。
● 查找導致此問題的網絡擁塞或電纜故障。
● 根據使用場景優化高級設置。

間歇性連接問題:

● 應檢查固件/驅動程序升級
● 使用不同的PCIe插槽或其他系統進行測試,以確保它識別網絡適配器
● 哪些應用可從Infiniband適配器中獲益?

高性能計算(HPC)


InfiniBand適配器特別適合高性能計算(HPC)應用,因爲它們需要快速的數據吞吐量和低延遲通信。快速移動數據且不受太多幹擾是InfiniBand技術的強項;因此,它主要用於科學模擬、財務建模和使用ConnectX-7適配器的大規模數據分析等。這些設備帶來的額外帶寬顯著提高了HPC任務的整體效率和性能,同時也降低了延遲,因此成爲任何高級計算基礎設施的必備條件。

數據分析和人工智能工作負載


數據分析和人工智能工作負載受益於更高的信息傳輸速率,這可以幫助它們在InfiniBand適配器的幫助下足夠快地處理更大的數據集和更復雜的計算。它確保在模型訓練階段進行高效處理,同時確保實時分析能夠輕松進行,因爲它具有高吞吐量、低延遲技術的特性,這極大地有助於跨集群內不同節點優化此類負載的可擴展性,從而可以更快地根據涉及大量數據的資源做出決策,尤其是當InfiniBand處理這些數據時。

企業數據中心


加快企業級數據中心內的資源管理,使工作負載優化變得更加容易,這一直是這類設備最擅長的一個關鍵領域,提供更快的速度,同時最大限度地減少延遲,這只能通過在這樣的環境中部署InfiniBand適配器來實現。事務往往會減慢應用的速度,但如果部署得當,它們將確保快速訪問信息,從而減少瓶頸,從而提高應用性能,尤其是在事務繁重的環境中。

如何維護和升級InfiniBand適配器?

定期維護技巧


定期固件更新:經常與制造商聯系以獲取固件更新,以確保最佳性能和保護。

物理檢查:檢查網絡適配器和連接是否有任何損壞、灰塵或磨損跡象。如有必要,請清潔它們並將其牢固擰緊。

溫度控制:經常檢查設備的溫度,並確保通過數據中心的適當冷卻將溫度保持在建議範圍內。

電纜管理:合理布置電纜,防止物理損壞和信號幹擾。

更新驅動程序:更新驅動程序將幫助您跟上不斷發展的標准,從而提高兼容性,同時爲網絡適配器添加功能。

監控性能:您應該能夠使用網絡監控工具,以便跟蹤與此適配器性能相關的指標,如果檢測到任何異常,則可能無法立即採取行動。

備份配置:定期備份網絡適配器的配置始終是一種很好的做法,以便在這些設備出現故障或被更換的情況下快速恢復設置。

何時以及如何升級適配器


性能下降:如果發現性能持續下降或延遲增加,請更新。

以太網和Infiniband適配器的技術進步:安裝以利用新技術或新功能,從而大大改善操作。

與EDRInfiniband和100GbE標准不兼容可能會導致網絡問題:當較新的軟件或硬件與現有適配器不兼容時,請升級。

支持結束:在制造商停止支持當前適配器型號之前升級。

需求增加:升級以有效處理更大的數據吞吐量或增加的工作量。

如何升級


檢查兼容性:確保新的適配器與您的其余基礎設施和軟件兼容。

備份配置:備份當前在此卡(適配器)上應用的所有設置和配置。

停機計劃:
安排在使用率較低的時段,盡可能避免中斷。

固件和驅動程序安裝:安裝更新的固件版本以及適合此特定類型/品牌/型號的驅動程序;通常可以從供應商的網站免費下載。

升級後測試:執行各種測試,以便我們可以確定升級後的卡在技術上和實踐上都表現得足夠好。例如,終端用戶不會遇到任何減速現象。

更新文檔:
更新與這些步驟中所做的硬件更改相關的系統文檔。

標題:Infiniband適配器綜合指南

地址:https://www.utechfun.com/post/394685.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡