亞馬遜當機問題暴露雲端服務弱點

亞馬遜公佈上周五系統停機,造成Netflix、Instagram、Pintrest等服務斷線的調查結果。該公司北卡羅來納州資料中心的停電發生電力突波(Spike)是主因,但亞馬遜的發電機的瑕疵卻是導致伺服器完全沒電,進而拖垮網路服務的另一元兇。

亞馬遜是使用雙重備援發電;一是不斷電系統(UPS),二是大型發電機。但事發當天,只有一座資料中心成功轉移到備援電力,但這台卻無法盡可能的持續使用UPS電力,最後導致電力耗盡,造成亞馬遜伺服器停機約10分鐘。

「我們對造成受影響客戶的不便及困擾十分抱歉,」該公司透過AWS發表聲明,「我們未來幾天,甚至幾周將投入大量時間來深入了解事件原因,並決定未來如何改善我們的服務和流程。」

停機10分鐘還只是事情的開始,因為該公司的伺服器得花了數小時來開機,並確保檔案系統還能正常運作。不過即使亞馬遜機器重新上線,它的客戶Netflix、Instagram還是等到周六才恢復服務。

亞馬遜此次解釋,比較像是挽救企業客戶的聲明,而不像是對終端用戶的道歉。伺服器產業相當重視「服務不中斷」,亞馬遜詳細解釋停機和負載機制,說明了它對此事的重視—尤其是Google compute Engine已摩拳擦掌進軍這塊雲端市場。


本文引用至: news.networkmagazine



--
由 網路行銷-網路賺錢 於 7/04/2012 07:35:00 上午 張貼在 *
arrow
arrow
    全站熱搜

    efortune4 發表在 痞客邦 留言(0) 人氣()