GlusterFS - Peer Rejected 錯誤的恢復

GlusterFS運行一段時間後, 出現 Peer Rejected 錯誤,通過摸索進行了恢復。網絡

現象:

sudo gluster peer status

Number of Peers: 2

Hostname: 192.168.199.249
Uuid: 2cfd2767-6454-4538-ab57-1abe91a570ff
State: Peer in Cluster (Connected)

Hostname: 192.168.199.173
Uuid: 35f0af2e-6fe2-4eb4-9ecb-d9e147460cf1
State: Peer Rejected (Connected)

顯示peer節點雖然鏈接可是沒法訪問。ui

診斷:

通常是網絡連通可是ID不一樣引發,如該節點從新安裝了glusterfs致使uuid不一樣,其它節點就拒絕訪問。spa

問題:

Peer Rejected 是 peer 運行中可能出現的一種狀態。code

當運行 'gluster peer status' 出現該狀態,該節點的 volume configuration將會再也不同步更新,由於該結點已經被排除到集羣以外。server

步驟:

在rejected peer上:同步

  1. 中止 glusterd
    • sudo  systemctl stop glusterd
  2. 在目錄/var/lib/glusterd, 刪除全部文件,除了 glusterd.info (是 UUID 文件)
  3. Start glusterd
    • sudo  systemctl start glusterd
  4. 添加好的 peers
    • sudo gluster peer probe 192.168.199.180
  5. 重啓 glusterd, 檢查狀態  'gluster peer status'
  6. 也許須要重啓屢次。
  7. 若是還不行:
    • 刪除glusterfs-server,從新安裝。
    • 到集羣中刪除該節點。
    • 從新添加該結點到集羣中。

個人GlusterFS節點使用上面的步驟後,恢復正常。io

相關文章
相關標籤/搜索