全文連接服務器
1. 故障描述
本案例是HP P2000的存儲vmware exsi虛擬化平臺,由RAID-5由10塊lT硬盤組成,其中6號盤是熱備盤,因爲故障致使RAID-5磁盤陣列的兩塊盤掉線,表現爲兩塊硬盤亮黃燈。 經用戶方維護人員檢測,故障硬盤應爲物理故障,表現爲:序列號沒法讀取,在SAS擴展卡上硬盤沒法識別。
ide
2. 數據備份與修復
故障發生後用戶方工程師與我公司聯繫,通過詳細諮詢,瞭解到故障比較嚴重,必須把RAID-5磁盤陣列帶到我公司進行檢測,檢測RAID-5的每塊成員盤是物理故障(磁頭損壞或者盤片劃傷)仍是邏輯故障。因爲狀況緊急,工程師在接到原盤之後,當即着手準備檢測。對能識別的好盤用鏈接到北亞鏡像服務器上使用WinHex作扇區級鏡像,同時對不能識別的壞盤進行檢測。
首先將壞盤鏈接到外部的SAS擴展卡上,加電後經過硬盤工做聲音判斷硬盤電機可以起轉,可是磁頭沒有進行尋道操做,因而嘗試把硬盤PCB分離下來對HDA組件氧化部分進行清潔操做,將PCB還原後故障依舊。因而和客戶溝通使用6號熱備盤的好PCB替換到故障盤上進行嘗試性修復,再將故障盤PCB上的ROM芯片替換到6號盤的好PCB上面後硬盤工做時起轉和磁頭尋道聲音都正常,可是在尋道結束後,有明顯的敲盤聲音,因而判斷有可能磁頭損壞。在和用戶溝通後嘗試使用6號熱備盤中的好磁頭對故障盤進行替換操做以讀取數據。在無塵室對故障盤進行開盤更換磁頭操做後,將故障盤鏈接到專業硬盤維修工做上進行檢測,發現故障盤已經不能識別,數據沒法讀取。
由於用戶有兩塊故障盤,以前嘗試修復的都是其中一塊,再次和客戶溝通嘗試對另外一塊故障盤進行修復操做。和先前的故障盤同樣,這塊盤的故障依舊是磁頭損壞,由於用戶的HP OEM盤價格昂貴,因而嘗試在網上購買ST原廠的相同型號硬盤進行磁頭更換。這塊硬盤的磁頭更換完成後,設備可以正常識別硬盤,因而將故障盤全部扇區完整鏡像到一塊相同容量的備份盤中。ui
3.重組RAID-5步驟
【判斷起始扇區】全部硬盤都鏡像好後就能夠重組了,用WinHex打開9塊盤(熱備盤不須要加進去重組),先把鏡像文件解析成磁盤。能夠看到這9塊盤的0扇區都有「55 AA」標誌,如圖1所示。
spa
圖1
查找結果如圖2所示,0x01C2H處表示該分區的類型,這裏顯示「05」,表明這是一個擴展分區。所以從0扇區看這是一個不正常的MBR分區結構。
orm
圖2
按圖1方式繼續往下找,分別在9號盤和8號盤找到了「55 AA」的標誌。9號盤查詢結果如圖3所示。這是一個正常的MBR分區,其0x01C6處數值表明指向的下一個扇區爲GPT的頭部。
blog