亞馬遜公佈了Amazon EC2雲服務器宕機的事故報告。
太平洋夏令時4月21日凌晨12:47,位於美國東區的一個可用區(數據中心)執行了一次正常的Amazon Web Services伸縮活動,爲了完成升級須要臨時轉移網絡流量,標準的作法是將流量卸載到Elastic Block Store(EBS)主網絡中的冗餘路由器。然而流量轉移未被正確執行,流量沒有被路由到EBS主網絡的冗餘路由器中,而是被路由到了冗餘EBS次網絡的低容量路由器中,它沒法處理如此高的流量。致使的結果是,受影響數據中心的許多EBS節點與其它節點徹底孤立開來,主網絡和次網絡同時斷開鏈接。用通俗的話說,亞馬遜在進行高速公路擴建工做,它不是關閉了建設中的高速公路的一條通道,而是不當心關閉了整個高速公路,迫使全部汽車穿過容量有限的城鎮公路,結果致使了嚴重的交通堵塞,全部人都被迫停在原地。相似去年中國發生的綿延100千米的大塞車。
本文來自solidot.com服務器