VMware虛擬化之VSA(vSphere Storage Appliance)羣集(二) 故障恢復詳測

VMware虛擬化 安全

VSAvSphere Storage Appliance)羣集故障恢復詳測 ide

在上一篇文檔中,曾詳細的介紹了VSA羣集的部署及安裝全過程,以及安裝過程當中可能會遇到的一些問題及對應的解決方法,本篇將介紹VSA羣集的容災及故障恢復狀況。部署一套環境,不能說是安裝完就完事了,確定要對故障發生時的恢復作必定的測試,才能更好的理解整個平臺的實用效果。   測試

8、故障恢復 spa

在以前的文檔中曾有說明,咱們的實驗採用的是三主機的結構,但不管是雙主機還三主機結構,都僅可以對單節點故障進行恢復,這個緣由,當了解了VSA的整個羣集結構就會很明白了,也正是所以,VSA羣集只有雙主機和三主機兩種部署結構模式。下圖爲VSA羣集三主機結構拓撲圖: 3d

其中:標示IP地址的圖標爲三臺ESXi物理主機,VSA-0VSA-1VSA-2爲三臺ESXi主機內構建的用於發佈NFS共享磁盤的SUSE Linux虛擬機,VSADs(淺藍×××標)爲每一個VSA虛擬機分別建立的兩個共享磁盤,而每兩個VSA虛擬機採用RAID1的模式實現相互冗餘共同提供兩個VSADs(灰×××標)鏡像模式的共享磁盤,最後共提供三個鏡像模式共享磁盤。這樣,其中任何一臺物理主機或者虛擬機斷電或者宕機,也不會影響到共享磁盤的VSADs的正常使用。這樣的容災模式是很是安全的。 orm

1.單節點斷電故障恢復操做 blog

這裏咱們已經將10.15.20.103這臺主機電源拔下,當前此主機處於斷電狀態時,VSA羣集狀態便以下圖: ci

    注:主機在斷電以後,對應的部分共享存儲盤處於已降級狀態,同時在映射拓撲中狀態也會有所改變。 資源

咱們給斷電的主機從新加電並啓動,在正常啓動完成後,當VSA羣集檢測到該主機信號後,會當即對羣集存儲進行恢復,恢復羣集及存儲狀態所需時間大約爲5分鐘左右。恢復後即爲下圖(消除了已降級狀態): 文檔

2.單節點主機癱瘓故障及替換恢復操做

這裏模擬了10.15.20.103這臺主機癱瘓故障,主機因爲硬件故障等緣由癱瘓,已經斷電且不能在羣集中運行,須要在維護該主機後或經過備用物理機來替換該主機時,VSA羣集的狀態會出現以下圖變化:

    要說明的是,若是主機故障致使系統崩潰,或者使用新裝好ESXi的備用機替換故障主機時,該如何操做呢?參考下面的方法,就能完成替換主機:

這裏咱們須要先準備好替換的備用ESXi主機,該ESXi主機的版本須要與VSA羣集中的其餘主機版本相同,在準備好替換的主機後,將新的主機鏈接進入vCenter,但不要手動將該主機加入VSA羣集中,

vCenter中的VSA Manager控制面板中的「設備」選項卡中,咱們能夠看到故障主機對應設備狀態已是「脫機」狀態,右鍵單擊此「脫機」狀態的設備,而後選擇「替換設備」,以下圖:

選擇了「替換設備」後,會彈出設備替換操做會話窗口,按以下圖示方法進行操做:

 

此處,便開始設備替換的安裝操做,會爲新的ESXi主機自動安裝VSA羣集。

自動安裝VSA羣集的時間約爲30分鐘左右,根據主機的配置以及已佔用資源的不一樣,所需時間可能會有差別,安裝好以後,VSA羣集狀態恢復以下圖:

注:咱們看到VSA羣集的數據存儲狀態依然是已降級狀態,這是由於替換上來的主機,尚未完成共享磁盤配置,而此配置,也是由VSA羣集自動完成的。

在爲新替換的ESXi主機安裝完VSA羣集後,羣集會自動開始恢復共享磁盤的配置,在vCenter的任務欄中,咱們會看到以下圖的任務正在進行:

 

該恢復操做包含兩個此任務,完成此配置的恢復,大約須要7~9小時的時間不等,而根據主機配置以及已使用資源的不一樣,時間可能會有差別。

配置恢復完成後,VSA羣集即恢復爲正常狀態。

 

注意:在自動安裝的VSA羣集,是默認不開啓vSphere DRS功能的,若是在使用過程當中由於須要開啓了vSphere DRS功能,則在作故障切換或者替換設備時,須要暫時關閉該功能,不然故障切換可能會由於資源池的緣由出現錯誤。設置開啓及關閉vSphere DRS功能時,在vCenter中右鍵單擊「VSA HA cluster」羣集,而後選擇「編輯設置」後出現設置會話框,詳情設置以下圖:

    至此,VSA羣集的故障恢復詳測結束。若有疑問歡迎投稿及聯繫本人。

 注:本文章PDF文檔已上傳至51CTO下載中心,連接地址:http://down.51cto.com/data/751543

相關文章
相關標籤/搜索