Lustre文件系統ost損壞,恢復操做

Lustre文件系統ost損壞,恢復操做spa

  1. oss1節點爲例,一個oss節點掛載了兩個OST

    

         2 .假如ost11 損壞,已沒法備份OST上的數據。blog

  

             

1)嘗試在管理節點或登陸節點掛載文件系統get

  

2)執行lfs df -h查看下。it

   

此時OST0001 狀態爲 inactive device OST0001即爲損壞的ost11ID,記錄這個ID號後在管理節點上卸載文件系統,umount -l /lustrefstest

 

3) mds節點上執行lctl dl查看元數據信息。登錄

  

 

  標紅部分爲損壞的OST配置

 

4)查看下OST0001的配置信息im

  lctl get_param osc.testfs-OST0001-osc-MDT0000.max_create_countd3

   

 

5)把active max_create_count的值都設置爲0數據

     

    

 

  此時OST0001狀態由UP變爲IN

  備註:active 設置爲0還能夠使用lctl conf_param testfs-OST0001-osc-MDT0000.active=0

  echo 0 >/proc/fs/lustre/osc/testfs-OST0001-osc-MDT0000/active

 

 

6)將ost11對應的/dev/sdc盤格式化,若是是現場環境必定要和用戶確認。

   使用fdisk parted對磁盤進行格式化,fdisk 最多可分配2T的空間。

  

7) 再將磁盤格式化爲lustre格式

    

 

備註: --writeconf 必要參數,若是lustre版本是最新版的能夠將--writeconf 替換爲--replace

--index OSTID號。

 

8) 再次掛載ost

   

 3. mds節點上將activemax_create_count 恢復到原來的值

  

  

4. 在管理節點或登陸節點上從新掛載文件系統便可。

 

相關文章
相關標籤/搜索