Lustre文件系統ost損壞,恢復操做spa
2 .假如ost11 損壞,已沒法備份OST上的數據。blog
1)嘗試在管理節點或登陸節點掛載文件系統get
2)執行lfs df -h查看下。it
此時OST0001 狀態爲 inactive device ,OST0001即爲損壞的ost11的ID,記錄這個ID號後在管理節點上卸載文件系統,umount -l /lustrefstest
3) 在mds節點上執行lctl dl查看元數據信息。登錄
標紅部分爲損壞的OST配置
4)查看下OST0001的配置信息im
lctl get_param osc.testfs-OST0001-osc-MDT0000.max_create_countd3
5)把active 和max_create_count的值都設置爲0數據
此時OST0001狀態由UP變爲IN
備註:active 設置爲0還能夠使用lctl conf_param testfs-OST0001-osc-MDT0000.active=0或
echo 0 >/proc/fs/lustre/osc/testfs-OST0001-osc-MDT0000/active
6)將ost11對應的/dev/sdc盤格式化,若是是現場環境必定要和用戶確認。
使用fdisk 或parted對磁盤進行格式化,fdisk 最多可分配2T的空間。
7) 再將磁盤格式化爲lustre格式
備註: --writeconf 必要參數,若是lustre版本是最新版的能夠將--writeconf 替換爲--replace
--index 爲OST的ID號。
8) 再次掛載ost
3. 在mds節點上將active和max_create_count 恢復到原來的值
4. 在管理節點或登陸節點上從新掛載文件系統便可。