大規模集羣故障處理

我相信每一個集羣管理員,在長期管理多個不同體量及應用場景的集羣后,都會多少產生情緒。其實這在我看來,是一個很微妙的事,即大家也已經開始人性化的看待每一個集羣了。   既然是人性化的管理集羣,我總是會思考幾個方向的問題:   集羣的特別之處在哪兒? 集羣經常生什麼病? 對於集羣產生的突發疾病如何精準地做到靶向定位? 應急處理故障之後如何避免舊除新添?   在長期大規模集羣治理實踐過程中,也針對各個集
相關文章
相關標籤/搜索