“你的電信卡還能用嗎?”
下午兩點多,小雷的一句話讓半個辦公室的人都擡起了頭:“啥?”
“我的手機沒信號了,你們的正常嗎?”,在提出這個問題之前,小雷已經先後檢查了手機卡余額、开關了三次飛行模式、重啓了一次手機並插拔手機卡一次,最後都沒能讓我的電信手機卡“復活”。
而且,在用手機裏的移動卡撥出電話並接通後,我更是確信我的手機沒有問題,難不成是電信崩了?於是,就有了开頭的疑問。在小雷提醒後,周圍使用電信卡的同事都开始查看手機。
“我也是,怎么有個電話打上X的符號?”“臥X,我的信號也沒了”“打下我手機看看?”“我剛剛也看到了,還以爲手機壞了。”
連綿的驚呼和吐槽,讓小雷確信不是我一個人的電信卡出了問題,懸着的心終於是落下了:“至少可以確定不是我的手機或手機號有問題”。此時,小雷的一些朋友也开始在群裏吐槽:“我的電信手機號突然接不到電話了,剛剛點的外賣因爲電話打不通,等了一個多小時才拿到”。
小雷的這位朋友與我並不在一個城市,而是遠在深圳,直线距離少說兩三百公裏,那么基本上可以確定,這次故障並不僅局限於小雷周邊乃至於廣州市,而是一個大範圍的網絡故障問題。
圖源:網絡
想到這裏,小雷打开微博搜索,果不其然發現了大量的吐槽和詢問:“你的電信卡能用嗎?”
電信,崩了
從微博用戶的反饋來看,本次電信的故障問題或許波及整個廣東省,深圳、惠州、東莞等地都有朋友向小雷反饋自己的電信卡確實無法撥打電話。以小雷淺薄的電信知識來判斷,這次廣東電信的故障程度,如果放在互聯網大廠中,肯定是達到P0級別的,毫無疑問的最高級別事故。
事實上,這已經不是今年電信的第一次大規模故障,如果你比較常關注互聯網新聞,那么或許還會記得3月29日,唯品會、騰訊等公司的线上服務均出現大範圍的故障問題,线上商城、微信支付、微信對話、QQ空間、QQ郵箱等多個服務均無法使用。
圖源:唯品會
唯品會暫且不說,微信和QQ作爲國民級的社交應用,幾乎每一秒都有大量的用戶在使用,所以微信QQ出現故障的相關熱搜幾乎是以火箭般的速度竄上了微博熱搜。在網友的疑問與吐槽中,微信、唯品會等受影響的企業相繼發布公告,稱此次故障是受機房故障影響,正在全力恢復中。
或許你已經猜到了,沒錯,出問題的就是電信在南沙設置的一個網絡機房,因爲冷卻系統故障導致機房設備溫度快速升高,觸發安全保護機制,大批設備被強制下线導致網絡服務宕機。按理來說,這是不應該出現的事故,作爲重要的網絡基礎設施,大多數機房都會有一套備份系統,目的就是在主系統出現故障時可以快速接手原先的工作,保證用戶的正常使用。
但是,從此次事故來看,備用系統不能說毫無作用,只能說起作用的時間實在是慢了點,備份系統一般被要求在短時間內可以直接上线,但是唯品會和騰訊最終都花了不少時間才重新上线系統(其中唯品會更是花了超過12小時),所以不管電信內部如何問責機房負責人,騰訊和唯品會都先後處理了不少管理層。
圖源:百度
其中,騰訊沒有公布最終的損失金額,而唯品會則在公告中稱,此次故障帶給公司的損失超億元,考慮到騰訊與唯品會的體量差距,騰訊的損失只會更大,如果事故不是發生在凌晨,數十億人民幣損失都是有可能的。
或許你認爲我在誇大其詞,實際上騰訊此前就公布了2022年的小程序GMV數據,全年GMV高達數萬億元,如果是在使用高峰期宕機,後果不堪設想。
說回今天下午的事故,與網絡機房故障不同,本次故障的主要是通話线路,電信的寬帶、移動數據網絡都沒有受到影響,甚至在iPhone上出現了詭異的信號零格,上網正常的情況。甚至因爲網絡數據還能正常使用,不少人都沒發現自己的通話功能出現了問題,只有在點外賣、接收驗證碼的時候,才會突然發現:“怎么半天都沒動靜的?”
圖源:雷科技
甚至有不少網友以爲自己的手機卡欠費,在充了幾百塊後才反應過來:“欠費的話應該上不了網啊”,然後上網一看才知道是電信出了問題,還有甚者以爲是手機壞了,直接在京東下單了新的手機。
樂子雖然不少,但是也側面反映了我們對網絡基建的信任,看到手機信號出問題沒有第一時間懷疑運營商,而是懷疑是不是自己出了問題。對於多數人來說,雖然現在打電話的機會已經不多,但是通訊電話作爲移動網絡的核心功能,一旦出現問題,會直接影響到我們生活的方方面面。
比如一些偏遠鄉村的老人家,基本上不會使用在线社交軟件,對外聯系只靠電話,如果在通話網絡宕機的期間有什么緊急事故發生,他們將無法聯系到自己的家人或者同村的朋友,還有諸如110、119、120等緊急電話,如果同樣受到影響,後果將不堪設想。
電信,怎么崩的?
關於此次電信的故障,官方暫時還沒有給出原因,目前在網上只能看到一些電信員工的回復以及故障通知書,在一則通知中寫到,首次故障通報的時間是下午的15時25分,而故障發生時間則是下午14時18分,故障等級達重要B級(現在估計已經提高到了A級)。
從後續的反饋來看,直到下午的16時30分,受影響的通訊網絡才逐步恢復,意味着整個廣東省的通訊網絡故障超過兩小時。基礎通訊網絡中斷兩小時,放在哪個地方都是非常嚴重的一次事故,而廣東的電信用戶數量更是高達1.88億(數據來源於網絡)。
對於事故的原因,電信暫時沒有給出官方的回復,不過各種小道消息倒是在網上亂飛,一些電信行業的從業者也給出了自己的猜測。
比如有人說是電信在中午搞高清通話升級,結果出現了系統故障,導致服務器被“送走”。
還有人以开玩笑似的猜測是不是電信的工作人員在部署高考信號屏蔽時,不小心點了全局屏蔽。當然,這個就肯定是笑話了,先不說一些地區使用的是信號屏蔽車,而且高考的信號屏蔽是連網絡信號都關閉的,並不會出現能上網卻不能打電話的情況。
此外,還有一個紅客微信公衆號說是電信設備爆出了0Day漏洞,導致關鍵設備被入侵。0Day是網絡安全中的一個技術名詞,專門用來指代那些危害性極大的漏洞,這些漏洞可以被攻擊者直接利用並入侵系統關鍵區域,一旦在關鍵系統或是設施中被人利用,輕則系統癱瘓,重則導致重大安全事故。
不過,關鍵設施從硬件到軟件一般都經過層層審查,更是基本全部使用國產設備和系統,除非是隱藏得十分深的硬件級0Day漏洞,否則基本上在部署前就會被找到並清除。而且,關鍵設施基本上都有直接的備份系統,可以短時間內進行切換,所以對於此次故障,不少業內人士都傾向於是系統層面的問題,同時也不排除未發現的0Day漏洞存在。
根據一些身處外省廣東電信用戶的反映,他們的電信手機卡即使遠在北京上海也同樣受到波及,有觀點認爲可能是數據庫出現問題,導致廣東的電信手機號碼被暫時剔除出網絡,無法直接獲得基站的認證,所以才會出現查無此號等故障返回。
當然,這些都只是猜測,真正的事故原因還是要等電信的公告或是事故報告才能知曉。不管怎么說,這都是一次非常重大的事故,受影響的廣東省不僅是電信最大的用戶省份,同時也是國內GDP最高的省份,一次波及全省的通訊中斷影響之大,恐怕你我都難以想象。
最後
隨着網絡在我們的日常生活中重要性日益增長,我想很多人都已經無法想象一個沒有網絡的世界會是怎樣的,這一次故障還只是影響到通訊網絡,對於日常使用微信等在线聊天工具交流的人來說影響尚且較小,但是,一旦發生全網絡中斷,那么恐怕會直接引起社會的恐慌。
對於運營商來說,如今的網絡基礎設施重要性不言而喻,想必也已經提前准備好了各種預案,即使如此,全省的網絡依然中斷長達兩小時,不管是從危機事故處理還是從容災能力來看,廣東電信這次都算是出了“大洋相”,希望能夠以此爲契機,優化容災能力和危機處理速度,畢竟誰也不想未來某天突然被斷網幾個小時。
標題:廣東電信崩潰數小時!史上最大移動通信災難,到底怎么回事?
地址:https://www.utechfun.com/post/223488.html