剛纔查看proxmox集羣運行狀態,沒想健康狀態那裏出個大紅叉。web
雖然不影響業務,但有問題,仍是得立刻處理。鼠標點這個紅叉,看看具體是什麼報錯!bash
再點第二個小紅叉後邊的「i」圖標,更詳細的信息出來了,以下圖所示:ide
原來是一個pg故障,嘗試用ceph進行修復,具體的操做以下:spa
ü 登陸系統(debian)肯定問題是否如web管理頁面的錯誤相一致orm
root@pve47:~# ceph health detail HEALTH_ERR 5 scrub errors; Possible data damage: 1 pg inconsistent OSD_SCRUB_ERRORS 5 scrub errors PG_DAMAGED Possible data damage: 1 pg inconsistent pg 2.162 is active+clean+inconsistent, acting [3,0,10]
root@pve47:~# ceph health detailblog
HEALTH_ERR 5 scrub errors; Possible data damage: 1 pg inconsistentit
OSD_SCRUB_ERRORS 5 scrub errorsclass
PG_DAMAGED Possible data damage: 1 pg inconsistent集羣
pg 2.162 is active+clean+inconsistent, acting [3,0,10]登錄
從輸出可知,確實發生了故障。
ü 執行修復
root@pve47:~# ceph pg repair 2.162 instructing pg 2.162 on osd.3 to repair
root@pve47:~# ceph pg repair 2.162
instructing pg 2.162 on osd.3 to repair
從修復輸出可知,發生故障的磁盤是osd.3,那麼就在proxmox的web管理界面界面找到它。
ü 選中磁盤osd.3,而後鼠標點擊重載。等待片刻,再換回到數據中心界面進行查看。
運氣還不錯,故障得以恢復!