Laxcus大數據管理系統2.0(11)- 第九章 容錯

第九章 容錯   在當前,由於集羣龐大的組織體系和複雜性,以及用戶普遍要求低成本硬件,使得集羣在運行過程中發生的錯誤概率,遠遠高於單一且性能穩定的小型機服務器,並且集羣在運行過程中幾乎是不允許停止的,這就更需要提供比單機環境複雜得多的錯誤管理方案。實際上,我們在產品設計、開發、運營的各個階段,有相當大一部分精力,都是用來獲取各種故障,和解決各種故障發生後的錯誤處理問題。對於這些錯誤處理,我們整體遵
相關文章
相關標籤/搜索