close

支付寶大面積癱瘓 災備能力引發爭議

【報道】

支付寶回應服務中斷數小時:光纖被挖 資金安全不受影響

摘要:支付寶底層的基礎雲平臺技術,不僅支撐著支付寶,也是浙江網商銀行的基礎,未來還計劃輸出給其他金融機構。因此,系統的安全保障能力更需高標準、嚴要求。

對於螞蟻金服和阿裡巴巴來說,2015年5月27日絕對是值得記住的一天,就在銀監會網站於當日下午發佈關於浙江網商銀行的開業批復的同時,支付寶的系統在下午5點左右出現瞭故障,這導致全國部分用戶支付寶錢包的功能無法使用,出現瞭 網絡繁忙、請稍後再試 的提示語。

對此,支付寶錢包官方微博在當天晚間6:05解釋稱,此次事故的是 由於杭州市蕭山區某地光纖被挖斷 而 造成目前少部分用戶無法使用支付寶 ,支付寶表示,運營商正在搶修,而支付寶的工程師正在緊急將用戶請求切換至其他機房。支付寶還稱,用戶的資金安全並不會因此而受到影響,而交易數據不同步的情況也會在修復後恢復同步。

從下午5時許到晚間7時左右,系統的故障在持續瞭兩個小時左右後被排除。擁有超過4萬億年交易總額的支付寶是中國第一大第三方交易平臺,約占中國整體社會消費金額的六分之一。由於支付寶的在金融領域的系統重要性程度,以及其獨特的基於雲計算的IT技術架構,此次故障受到各方關註。

對於導致此次事件的原因,螞蟻金服方面的解釋並未獲得金融和互聯網界的廣泛認同。業界聚焦於這樣一個問題,如果按金融機構系統災備標準衡量的台中靜電機租賃話,即使在出現光纜被挖斷的情形,系統的運行也應該正常無誤。

一位資深電信領域專傢表示,現在網絡架構多中心制決定瞭,任何一個節點出現問題,它的任務將由其他中心來承接。而支付寶肯定是多節點多中心制。任何一點斷服,都會由其他節點來進行服務。而且支付寶的路由非常多,其系統也不可能隻接一傢運營商,即便是隻接一傢,肯定也是多路由接入。

另一位傳統金融機構的系統安全領域專傢稱,從理論上講,支付寶應該全部是互聯網出口,也就是說,所有的入口和出口都是基於互聯網通信或者電信的節點來實現數據的交換和通信,關鍵節點出現斷電或者光纖挖斷的情況,理論上應該有備份的接口,就相當於可以放棄出現故障的線路,通過其他的專線可以繼續保證運行。他因此推斷斷的電纜應該是離主機房比較近的一根線。

簡而言之,在光纜被挖的情況下,整個系統的切換應該可以更加順暢。

在我國金融領域,金融機構涉及客戶資金的重要系統都有災備系統。比如,目前國有大型銀行基本上是采用 兩地三中心 的模式,即同城除瞭有一個災備中心以外,異地也有一個災備中心,這樣就可以應對戰爭、重大災難等桃園靜電機租賃極端情形。因此,當一個機房出問題時,系統會切到同城或者異地的災備中心。

湯森路透的金融網絡網絡號稱世界最大的, 它處理著全球實時的金融數據,其系統的建設要求就是在自然災害或戰爭的時候也不能宕機,兩條不同電信公司的光纜和不同電力公司的電纜分別從機房的兩個方向浸入,同一個機房的所有系統實時雙備份,並建立異地(巴黎、日內瓦)機房同時實時處理相同的數據。

一位國有大型銀行的專業人士分析,通常來說,如果是同城災備,客戶根本感受不到延遲,如果是異地,系統的切換也會在較短的時間內完成。但無論同城還是異地,兩個小時的系統切換的時間對於支付寶這樣一個金融支付系統來說顯然太長。

這一說法得到多位接受《財經》記者采訪的電信技術人士的支持。中國電信的一位技術高層人士分析,台北靜電油煙機租賃服務故障切換機制應該是自動的,根據一定的事先設置的策略,無需人為幹預,人工可以在服務切換後,再重新定義流量疏導方式。

一位螞蟻金服的高管解釋瞭切換時間較長的原因。他表示,大流量網站實時切換涉及資金時有難度。切換時的數據要確保不丟不錯,所以放緩速度是為瞭安全,對此,他們也在內部討論這個選擇的利弊,但認為,首先要保證客戶資金安全,當然未來仍有優化空間。在這次恢復中,支付寶已發現瞭可以更快恢復的一些環節,未來出現類似情況有把握更快且更安全的恢復。

而某大型國企網絡運維人員則認為,從技術角度看,支付寶此次事故可能是內部應用模塊出瞭問題,未經嚴格驗證的應用被統一升級後,被意外觸發到未知狀態,導致出現此類問題。

上述運維人員還表示,經他觀察,支付寶DBA(數據管理人員)緊急恢復瞭RPO=10days的完整數據(RPO,Recovery Point Objective,復原點目標,是指當服務恢復後,恢復得來的數據所對應時間點,理想的狀態是RPO=0,故障出現立即恢復,但需要極大投入),並不停地進行分段增量數據恢復,歷時約2小時餘,這就是應用模塊的問題。

上述中國電信技術人士則分析認為,出現這種問題的可能性是,支付寶多個數據中心之間的自動流量切換機制出現問題,隻能人工介入。還可能是其他三種原因:一是很有可能是支付寶遭到瞭攻擊;二是支付寶的路由配置癱瘓瞭;三是支付寶的雲服務器癱瘓瞭,亞馬遜也出現過這個問題。號稱最先進最安全的阿裡雲系統對自傢業務並沒支撐好。

就以上相關問題,《財經》記者詢問瞭螞蟻金服方面,螞蟻金服回應稱,具體的技術分析正在加緊進行,但得出結論判斷還需要一段時間。

微妙的是,在螞蟻金服更早的一份媒體回應中稱,之所以花費較長時間,是在流量向支付寶位於深圳的數據中心遷移的時候,切換系統也受到瞭光纖斷裂的影響,所以切換上花費瞭一些時間。這與 技術上他們可以做到更快恢復,之所以較慢是為瞭確保不丟數據 這一說法並不一致。

金融領域的系統安全一直是監管機構的重點。2013年6月,工行在系統升級的時候也曾出現全國大面積癱瘓的情況,根據當時媒體的報道,全國多地用戶在登陸網銀系統時均出現瞭 登陸失敗,因系統原因暫無法獲取當前交易結果 的提示,但是整個問題在1-2個小時內處理掉瞭,其系統的回退也很快。即便如此,這次事故也被監管機構當成案例來反復 敲打 各傢銀行重視系統安全。

業界人士認為,與工行一樣,支付寶的網絡也具有系統重要性。更重要的是,支付寶底層的基礎雲平臺技術,不僅支撐著支付寶,也是浙江網商銀行的基礎,未來還計劃輸出給其他金融機構。因此,系統的安全保障能力更需高標準、嚴要求。

隨著雲計算和大數據的逐步普及,以及人們在互聯網應用越來越重的資產托付,IT技術領域普遍呼籲互聯網公司改變 盡力而為 的服務承諾和網絡架構,向傳統電信、IT領域高達99.999%的 5個9 安全級別靠攏。

一位資深的業內專傢表示,此次故障事件,給瞭支付寶反思,但新興事物就是在這種經驗的積累中不斷成長,公眾和媒體對此也應有一定的寬容度。這就像跳水,起跳不錯,空中動作也還行,但入水壓水花不夠好,未來還有改進空間。

台灣電動床工廠 電動床

台灣電動床工廠 電動床

AUGI SPORTS|重機車靴|重機車靴推薦|重機專用車靴|重機防摔鞋|重機防摔鞋推薦|重機防摔鞋

AUGI SPORTS|augisports|racing boots|urban boots|motorcycle boots

arrow
arrow
    創作者介紹
    創作者 r35UHab2h 的頭像
    r35UHab2h

    冬季仙人掌

    r35UHab2h 發表在 痞客邦 留言(0) 人氣()