一次ceph心跳機制異常的處理

部署使用ceph集羣的時候遇到一個情況,在大規模集羣的時候,有節點網絡或者osd異常時,mon遲遲不把該異常的osd標down,一直等待900s後mon發現該節點的osd一直沒有更新pgmap才把異常的osd標down,並更新osdmap擴散出去。 現象:部署使用ceph集羣的時候遇到一個情況,在大規模集羣的時候,有節點網絡或者osd異常時,mon遲遲不把該異常的osd標down,一直等待900s
相關文章
相關標籤/搜索