斷連4小時,5G覆蓋下的廣東電信怎么了?

2023-06-17 18:10:13    編輯: robot
導讀 來源:與非網eefocus 作者:劉浩然,題圖來自:視覺中國 6月8日下午,有大量廣東電信用戶反饋手機出現了打不了電話、上不了網的情況。事發時正值高考期間,而且斷連並沒有在短時間內迅速恢復,這一消息...

來源:與非網eefocus

作者:劉浩然,題圖來自:視覺中國

6月8日下午,有大量廣東電信用戶反饋手機出現了打不了電話、上不了網的情況。事發時正值高考期間,而且斷連並沒有在短時間內迅速恢復,這一消息也迅速被頂上各大平台熱搜。

據悉,本次受到影響的用戶並不只是位於廣東的電信用戶。

據網友證實,只要你用的是廣東電信卡,不論人在哪裏,都可能會出現不能打電話的情況。根據2021年廣東電信官方資料顯示,廣東電信的用戶總數量達到4500萬以上。

這次“斷連”事件不僅影響範圍廣,恢復時間還很長。

據網友評論稱,很多人在下午兩點左右就出現了不能撥打電話的情況。官方微博在下午4點左右通報了這一事件。

不過,斷連被沒能像以往一樣很快恢復。

一般來說,發生概率最高的服務器宕機事件可以通過重啓服務器解決。而省級電信部門是一定擁有一套可快速上线的服務器備份的。在備用服務器協助下重啓,可以保證絕大部分問題在半小時內解決。

2021年12月10日下午5點20左右,陝西電信曾出現網絡故障,西安、臨潼、寶雞等多地用戶無法上網,但在下午5點50分前後,網絡就已經基本順暢。2022年1月12日0:27,中國電信出海信號受阻,官方通報爲設備故障,經過緊急處置,於0:51修復完畢。

然而回顧本次事件,通信全面恢復時間可能長達4~5小時。直到晚上7點多才完全恢復。

本次事件還有一點十分特殊,就是受影響用戶僅電話與短信功能無法使用,上網功能不受影響。

在斷連之初,電信內部其實已經流出了本次事故的大致原因。後來經過多名通信專家確認,已經可以基本得出結論:廣東電信的核心網出現故障,LDRA到HDRA之間鏈路出現擁塞現象。專家解釋,鏈路擁塞原因可能爲某設備商的數通設備出現異常,導致數據包重傳,引起信令風暴。應急處理方法是在SBC部署了流量控制流程,以及將某設備商的路由器隔離。

什么是LDRA與HDRA?爲什么只有廣東電信的用戶受影響?爲什么故障只影響通話而不影響網絡?本文將帶你分析手機通話的內部過程,找到斷連的真正原因。

從撥出到接聽,發生了什么?

手機從電話按下撥出鍵,到接聽人接聽爲止,這一過程並不簡單,其中要涉及到復雜的信令流程。

在你撥出電話前,手機其實早早地开始准備將你的“聲音”傳遞出去。

通常手機在剛开機的時候是不能撥打電話的。這時需要等待手機進行“搜索信號”。只有當手機頂部狀態欄出現三大運營商的名字後,我們才能撥打電話。這個過程其實就是在手機與小區基站之間建立連接,包含小區搜索、讀取系統廣播(隨機接入)和網絡側注冊登記(附着)三個過程。

這裏的“小區”並不是我們認識中的居住小區,而是被蜂窩網絡劃分出的一個個六邊形區域,每個區域都會有一個基站。通常來講一個基站對應一個小區,即以基站爲中心的一片覆蓋區域,若基站覆蓋範圍較大,還可以將小區劃爲不同的扇區,一根天线負責一個扇區的信號傳輸。

當手機开機後,一般會從手機射頻端檢測出一個功率最大的小區,接着手機會和該小區的基站達成頻率與時隙同步,這樣手機就可以使用當前基站的網絡服務,最後再進行驗證等工作,確認該手機入網的合法性。之後你就具備了撥打電話的條件了。這個過程在开機後會多次重復,使手機始終與信號最強的基站(或多個近處的基站)保持連接。

回到打電話的流程中,手機中的麥克風會將聲音這種模擬信號轉化爲數字信號,通過基帶芯片進行編碼後,通過天线將信號(高頻脈衝)散發出去。基站的收發器收到信號,會對信號進行進一步處理並上行,然後通過光纜傳遞到目標區域的基站。之後的流程便是將上述流程反向走一遍,接收方就能聽到語音了。

不過,這個過程十分簡化,其中也省略了一個關鍵步驟,基站怎么知道你要打電話的人在哪個基站旁邊?其實,這個流程與手機初次連接基站時的信息交換相關。手機SIM卡在注冊時都會有歸屬地,比如本次上了熱搜的廣東電信,歸屬地就是廣東,當然歸屬地往往還會細分,例如廣州電信、深圳電信、佛山電信等。歸屬地的交換中心(MSC)中會存儲所有注冊的SIM卡信息。

MSC具有號碼儲存譯碼、呼叫處理、路由選擇、回波抵消、超負荷控制等功能。作爲網絡核心,還支持位置登記、越區切換和自動漫遊等移動管理功能,以及信道管理、數據傳輸,以及包括鑑權、信息加密、移動設備識別等安全保密功能。

當手機上網後,運營商的服務器(交換中心,MSC)會記錄該手機最後出現在哪個基站旁邊。

如果呼出用戶和被呼用戶都在歸屬地,那么手機的信號就會通過呼出手機—基站—呼出地MSC—光纜(核心網內部通信)—被呼地MSC—基站——被呼手機傳輸。

如果被呼用戶不在歸屬地,被呼MSC會向被呼用戶所在地的MSC轉發呼叫請求,再通過基站連接。這個路徑就是呼出手機—基站—呼出地MSC—光纜—被呼歸屬地MSC(轉發請求)—光纜—被呼地MSC—基站—被呼手機,此時呼出地與被呼地之間仍然通過核心網內部光纜直連,但這中間需要通過當地的MSC轉發才能接通。

斷連的原因

在初步的了解了手機通話原理後,我們來嘗試一步步分析斷連原因。

或許你曾經有過這種經歷,當你正在玩手機網遊,與對手大战300回合的時候,突然一個電話打過來,手機瞬間失去網絡連接。雖然你一瞬間掛掉了電話,但這短暫的斷網還是讓你輸掉了關鍵團战,導致遊戲失敗。

如今這種令人“暴躁”的經歷已成歷史,4G時代後,使用VoLTE網絡的手機已經可以做到邊打電話邊上網了。這種改變的關鍵,就在於過去上網與通話使用的是同一條鏈路,如今則變爲兩條,打電話業務通過IMS(IP Multimedia Subsystem,IP多媒體子系統)线路傳輸,而互聯網則通過LTE线路傳輸,通話再也不會佔用網絡通信的通道。

圖源:鮮棗課堂

正是由於通話與網絡各自獨立,造成了故障僅影響通話與短信,而不影響網絡的結果。不過這僅解釋了其中一部分原因,斷連的關鍵還是要剖析核心網內部的故障。

我們常見的網絡構造,從2G到5G,基本可分爲3層,即接入層、匯聚層、核心網。我們日常能看到的基站,就屬於接入層。

當基站收集到手機發出的信號後,會經過承載網傳輸到核心網,承載網可以簡單理解爲信號的傳輸高速路,通過光纖將信號從基站傳輸到核心網上。這一過程與前文提到的手機撥打電話的通信過程類似。

核心網是連接移動接入網和外部網絡的關鍵部分,爲用戶提供了核心業務的支持,如語音通話、短信、數據業務等。它就像一個巨大的交換機或路由器,將來自世界不同角落的信號分發到目的地。因此,核心網需要支持海量的用戶接入,還需要保證高可靠性與安全性。

前文提到的MSC交換機也是核心網的一部分,只不過MSC是基於2G通信網絡架設的,在進入LTE時代後,MSC的功能就被集成在了電路域(CS網絡)中,3G時代又歸爲IMS系統中。

隨着4G、5G網絡的鋪开,核心網逐級向基於IP的全互聯的網狀網絡轉向,這其中業務、安全、維護及擴展性等問題,都將成爲網關升級重點。目前,DRA的部署和建設,可以真正實現核心網的擴展,簡化網絡,實現快速部署、高效維護及增強網絡安全。

DRA即Diameter Routing Agent,路由代理節點。DRA節點負責LTE Diameter信令目的地址翻譯和轉接, 實現LTE用戶的鑑權、位置更新、計費管理等功能。Diameter信令網採用分級、分區組網架構,由信令轉接點DRA分區匯接Diameter信令節點的信令消息。一般DRA節點會劃分省內與省外。其中省內按照各地區承載量部署LDRA,每個LDRA再劃分不同網元,網元與不同LDRA通過網狀相連。最終,省內不同的LDRA會統一接入省級的HDRA中。

Diameter信令網網絡結構  圖源:51學通信

現在我們可以簡單分析廣東電信斷連的真正原因了。

從通報中,我們了解到LDRA向HDRA傳輸受阻,而本次事故影響遍及全省,則HDRA的某台設備出問題的概率較高。其中DRA節點掌握着用戶的鑑權、位置更新等重要功能,可以說已經成爲本地用戶的數據庫。DRA還承擔了曾經MSC交換機的責任,負責向外界發送注冊用戶信息。因此,重要DRA節點宕機,導致整條IMS线路不通,直接影響了所有廣東電信用戶的通話與短信功能,即使是身處外地的用戶也無法避免“用戶數據庫丟失”的問題。

有業內人士分析了多個受影響案例後發現,廣東電信用戶之間不能互打電話,顯示空號,而電信用戶撥打其他運營商(移動、聯通)則可以打通,反過來卻不行。這也證明DRA某設備損壞推論的合理性。

寫在最後

其實,本次廣東電信大範圍長時間斷連背後,其實隱藏着一個更加重要的隱患,那就是防災冗余機制沒能發揮作用。

2022年12月,人民郵電報刊文《中國電信研究院:5G核心網容災和安全能力提升》,文中重點講述了中國電信已經實現了5G核心網用戶數據庫網元全故障極端場景下仍保持用戶業務的可用,數據逃生時長從原本的180分鐘縮短到10分鐘。

其中在辦法的實施上,中國電信採用5G用戶數據庫全故障快速應急逃生方案,當雙機熱備的兩台用戶數據庫網元中的一台發生故障時,就觸發提前向4G核心網快速批量導入用戶逃生數據;當5G用戶數據庫兩台都發生故障時,快速逃生到由4G核心網承接業務。文章講到,該方案在5G用戶數據庫網元全故障場景下,對已經在线的用戶啓用特殊的免鑑權流程,保障超過80%已在线用戶的基礎業務不受影響。

然而本次斷連事件中,中國電信曾經測試的防災措施並沒有發揮作用,甚至數據恢復時間要遠超180分鐘。這或許是因爲5G核心網並沒有出現故障,該防災機制並沒有設置3G數據向上逃逸的方案。

但就目前來說,電話與短信仍然是用戶的重要通信方案,它並沒有因爲數據網絡的出現而完全消失。更重要的是,無論4G、5G通信有多快,但依舊面臨覆蓋面積有限的問題,因此2G或3G通信仍舊是重要的備份通信方式。

縱使電話與短信功能的重要性在逐漸下降,還是希望全國運營商能通過該事件警醒,繼續提高或優化防災能力,若未來發生“斷網”5小時事故的話,那造成的影響,可能就不可估量了。



標題:斷連4小時,5G覆蓋下的廣東電信怎么了?

地址:https://www.utechfun.com/post/226321.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡