EMC存儲raid5陣列癱瘓,數據恢復成功全過程,學會就是賺到

1、服務器數據恢復故障描述

服務器型號:EMCVNXe3100存儲
硬盤數量:8塊
Raid級別:raid5磁盤陣列
故障表現:2塊硬盤離線,服務器崩潰,上層應用不可用
故障狀況預判:典型的硬盤離線數量超過raid5的冗餘數量致使的服務器數據丟失,能夠經過數據恢復操做對原始數據進行恢復,預估數據恢復成功率爲90%。服務器

2、對服務器數據進行備份

數據恢復工程師首先將客戶服務器內的全部硬盤經過鏡像的方式進行備份,在備份過程當中注意檢查掉線硬盤是否存在物理故障,在本次數據恢復案例中,客戶兩塊掉線硬盤均不存在物理故障,直接鏡像便可。工具

3、服務器底層數據分析及數據恢復過程

鏡像完成後,數據恢復工程師歸還了客戶原始硬盤,開始在鏡像文件上分析底層數據,通過底層數據分析計算出服務器原始的硬盤盤序,raid條帶大小、raid陣列信息等,經過數據恢復工具重組raid。
因爲LUN是基於RAID組的,所以須要根據上述分析的信息將RAID組重組出來。而後分析LUN在RAID組中的分配信息,以及LUN分配的數據塊MAP。因爲底層只有一個LUN,所以只須要分析一份LUN信息就OK了。而後根據這些信息使用raid恢復程序,解釋LUN的數據MAP並導出LUN的全部數據。調試

4、解釋ZFS文件系統並修復

數據恢復工程師對導出的lun進行了文件系統解釋,在文件系統解釋過程當中出現報錯,數據恢復工程師對報錯內容進行分析,調試文件系統解釋程序,通過分析與調試確認是因爲存儲中某些元文件損壞致使解釋zfs文件系統程序報錯。數據恢復工程師針對這些損壞的文件進行了手動修復,以確保zfs文件系統能夠被正常解析。數據分析

5、服務器數據恢復成功

通過對zfs文件系統的修復和解析,驗證最新數據,通過驗證數據無誤。聯繫客戶管理員對恢復的數據進行驗證,確認數據恢復成功,數據恢復率爲100%。程序

相關文章
相關標籤/搜索