前言安全
近期再給一個用戶更換服務器硬盤時發現,一是RAID配置錯誤,使用300GB的硬盤給600GB的磁盤作熱備,另外是更換的硬盤型號不對致使數據沒有同步。新近入職的管理員若是接手的有舊的服務器,有時間應重點檢查一下硬盤及RAID信息,看是否有離線的硬盤或配置不合適的地方好及時糾正。服務器
正文ide
今年4月上旬,有個單位的2臺服務器硬盤壞了3塊硬盤,客戶讓送3塊600GB的硬盤並幫着給換一下。到了現場我看到了這兩臺服務器,其中一臺服務器有2個硬盤亮黃燈(如圖1所示),另外一臺服務器有1個硬盤亮黃燈(如圖2所示)。3d
圖1 2塊硬盤亮黃燈blog
圖2 1塊硬盤亮黃燈get
仔細一看,這兩臺服務器,每臺都配置了1塊300GB硬盤、3塊600GB硬盤。當時比較奇怪怎麼有這種配置,難道這塊300GB的用來裝系統、另3塊600GB的作RAID-5存數據?同步
當時我和客戶說,圖1中這種壞了2塊硬盤的可能須要作數據恢復了,由於3塊硬盤的RAID-5中同時壞2塊,此時換盤是不行了。當時這臺服務器已經不能啓動了(圖2中的服務器還在使用,能進入系統)。it
圖1中壞2塊硬盤的服務器,打開電源進入RAID界面,看到0一、02槽位的硬盤爲Failed狀態,如圖3所示。class
圖3 兩塊硬盤失敗軟件
按Ctrl + N組合鍵進入PD Mgmt以後整我的就有點暈了,槽位0的300GB硬盤居然配置成了熱備磁盤!如圖4所示。
圖4 300GB的硬盤被配置成了全局熱備
客戶說這臺服務器已經使用多年,原來也壞過(一塊)硬盤,換了以後就繼續使用了。此次是系統不能用了才發現壞了兩塊硬盤的,覺得換上就能繼續使用了。當時這臺服務器買的時候是1塊300GB的硬盤,財務軟件公司的人說一塊硬盤不安全,又買了3塊600GB的硬盤作的RAID-5,是軟件公司的人給配置的。估計當時這個軟件公司的人也不是很懂硬件,就這樣配置上了。
另一臺服務器只壞了一塊硬盤,換上硬盤以後數據開始同步。由於看到的第1臺服務器RAID配置不合適,我從新啓動服務器進入RAID卡配置模塊,果真這塊300GB的硬盤也被配置成了熱備磁盤,如圖5所示。同時新換上的硬盤已經開始重組數據。
圖5 數據同步與熱備磁盤配置
這是這臺服務器更換硬盤後的相片,如圖6所示。
圖6 第2臺服務器更換硬盤以後
這時客戶說,還有一臺服務器,年前換了一塊硬盤,此次來了順便幫着給檢查一下,這一檢查就又發現新的問題了。
第三臺服務器也是3650 M5,在另外一個機房,槽位3的硬盤是年前換的,這個機房明顯環境好一些,服務器硬盤上的灰塵也少一些,如圖7所示。
圖7 槽位3的硬盤是年前換上的
從新啓動進入RAID卡,300GB的硬盤仍是配成了熱備磁盤,又是熟悉的配方、熟悉的味道。可是,槽位3的硬盤是Unconfigured Good,這塊硬盤沒有同步,如圖8所示。
圖8 硬盤沒有同步
仔細看圖7,發現新換上的硬盤托架上的序號和原來的托架序號不一樣(圖6中新換上的序號和原來的相同)。好在還有2塊新買的硬盤暫時沒有用上,取下年前購買的硬盤,換上此次帶來的硬盤,此時硬盤開始重組數據,此時新換上的硬盤黃燈、綠燈交替閃爍,如圖9所示。
圖9 硬盤數據開始同步
在RAID界面中數據開始重組,如圖10所示。
圖10 數據重組
一個多小時以後數據重組完成,硬盤綠燈閃爍,此時這臺服務器檢查完成,如圖11所示。
後期建議,若是客戶須要熱備磁盤,應該是每臺取下原來300GB的硬盤,添加一塊600GB的硬盤並從新配置成熱備磁盤。
圖11 硬盤狀態正常