Proxmox ceph故障處置備忘


剛纔查看proxmox集羣運行狀態,沒想健康狀態那裏出個大紅叉。web

001.jpg

雖然不影響業務,但有問題,仍是得立刻處理。鼠標點這個紅叉,看看具體是什麼報錯!bash

002.jpg

再點第二個小紅叉後邊的「i」圖標,更詳細的信息出來了,以下圖所示:ide

003.jpg

原來是一個pg故障,嘗試用ceph進行修復,具體的操做以下:spa

 

ü  登陸系統(debian)肯定問題是否如web管理頁面的錯誤相一致orm

root@pve47:~# ceph health detail
HEALTH_ERR 5 scrub errors; Possible data damage: 1 pg inconsistent
OSD_SCRUB_ERRORS 5 scrub errors
PG_DAMAGED Possible data damage: 1 pg inconsistent
pg 2.162 is active+clean+inconsistent, acting [3,0,10]

root@pve47:~# ceph health detailblog

HEALTH_ERR 5 scrub errors; Possible data damage: 1 pg inconsistentit

OSD_SCRUB_ERRORS 5 scrub errorsclass

PG_DAMAGED Possible data damage: 1 pg inconsistent集羣

pg 2.162 is active+clean+inconsistent, acting [3,0,10]登錄

從輸出可知,確實發生了故障。

ü  執行修復

root@pve47:~#  ceph pg repair 2.162
instructing pg 2.162 on osd.3 to repair

root@pve47:~#  ceph pg repair 2.162

instructing pg 2.162 on osd.3 to repair

從修復輸出可知,發生故障的磁盤是osd.3,那麼就在proxmox的web管理界面界面找到它。

004.jpg

ü  選中磁盤osd.3,而後鼠標點擊重載。等待片刻,再換回到數據中心界面進行查看。

005.jpg

 

運氣還不錯,故障得以恢復!

相關文章
相關標籤/搜索