故障轉移集羣-1

應用於:Window server 2012 (R2)

羣集的優勢:
強烈建議看以下系列視頻!!!
source:B站視頻 故障轉移羣集的通用原理(Windows Linux都適用,1-4集,每集十幾分鍾)
https://www.bilibili.com/video/BV1Fa4y1Y7ie/?spm_id_from=333.788.videocard.4

  1. 可用性
    增加平均失效時間 MTTF mean time to failure
    減少平均恢復時間 MTTR mean time to recover
  • 如歌提高可用性?
    在這裏插入圖片描述
    如何增加MTTF,服務器哪些組件可能會失效?網絡?存儲?操作系統?電力?
    如何解決這些故障?
  1. 可伸縮性
    可擴展性解決的問題就是:慢,服務器慢了,就加硬件,一顆CPU變兩顆,i5變i7。
    scale up,向一個系欸但添加更多資源,內存、CPU、磁盤。但是對於硬件來說總是有天花板,所以就有scale out,增加多臺節點(節點就是服務器)來分擔負荷。
  2. 可管理性
    災難恢復:集羣幫助應用系統從災難中進行恢復
    滾動更新,打補丁、修復操作系統、硬件調整,如果沒有冗餘、羣集,系統就會有宕機時間,如果有羣集就可以進行滾動更新,一個一個節點進行更新。

常規故障轉移羣集特性

  1. 只能將資源指派給單一節點
  2. 羣集裏面的節點數量可感知,添加節點或減少節點,羣集也有所感知
  3. 羣集中的節點也會感知到資源是運行在本地還是其他節點上
  4. 應用程序客戶端和羣集階段可進行網絡通訊

故障轉移羣集概述

在這裏插入圖片描述
上圖爲典型的故障轉移的拓撲結構。

  1. 裏面有節點1,2(也就是有兩臺服務器1、2)

  2. 通過共享存儲構建了基於共享存儲的羣集(羣集的存儲可以用共享模式和獨立模式,共享模式使用於實時更新的場景,這樣節點可以使用同一套存儲,而不需要各個節點來進行更新同步,比如wiki這樣的應用,會隨時更新,共享存儲會更適用)

  3. 兩個節點之間需要某種機制來進行相互的狀態感知,這個就叫做心跳網絡。通過心跳網絡機制,每個節點知道彼此的狀態,一般常用以太網專用網絡。

  4. 其次,故障轉移羣集於客戶機的網絡連接,計算節點和客戶機通過局域網LAN的鏈路進行連接,進行連接的切換,若是負載平衡的場景,就可以同事訪問多個節點。
    在這裏插入圖片描述

  5. 羣集化的服務和資源:在故障的時候,可以講服務和節點轉移到其他資源上,在一個時間點上,只能運行在一個節點上,當一個節點失效時,可以講服務轉移到另一個節點上,資源可以是:IP地址、存儲、主機名、共享磁盤等等

  6. 故障轉移羣集使用的網絡規劃:
    公共網絡:用來相應客戶端請求
    私有網絡:心跳網絡,要考慮冗餘
    存儲網絡:與外部存儲系統網絡,要考慮冗餘

仲裁模式概念 Quorum

在故障轉移羣集中,仲裁定義足夠的可用集羣成員提供服務。
多個節點想同時寫入時,如何分配優先級,防止磁盤損壞
仲裁:

  • 投票 vote
  • 根據不同仲裁模式,可使用節點,文件共享和共享磁盤用來投票
  • 足夠的票數時,允許故障轉移羣集保持在線
    合法:
  • total_nodes<2*active_nodes

微軟2012 仲裁機制很靈活,可以基於節點、文件共享、共享磁盤。
微軟的仲裁模式:

  1. 節點多數模式,只有節點纔有投票權,當超過半數節點在線時,才滿足仲裁要求
    場景:比如說,有三個節點,節點1 宕機,羣集還有兩個在線,然後再壞一個節點2,那麼三個節點都不工作。
  2. 節點和磁盤多數模式:羣集中的節點和見證磁盤纔有投票權,當超過半數的vote在線時才滿足仲裁條件
  3. 羣集中的節點和見證文件共享猜有投票全,也要求半數
  4. 非多數:進磁盤模式,只有仲裁共享磁盤才能進行投票,當共享磁盤在線時才滿足仲裁要求(很少見)
    如果不夠法定人數,整個羣集都會宕機

默認情況下,如果羣集節點是奇數,選擇節點多數模式,如果節點是偶數,選擇節點和磁盤多數模式。
異地災備羣集,推薦採用節點和共享文件夾的模式。

故障轉移集羣給很多服務器負載工作提供了高可用性和可擴展性,其中包括Exchange、Hyper-V、SQL、文件服務器。這些服務器應用可以在物理服務器上運行,也可以在虛擬機上運行。
本章要介紹的故障轉移集羣可以擴展到64分物理節點、8000個虛擬機。
應用場景:
5. 文件共享存儲的高可用和持續可用,比如SQL和Hyper-V虛擬機
6. 物理機或虛擬機的高可用羣集角色

硬件要求:
7. 故障轉移集羣的硬件組件必須滿足windows server 2012的質量認證
8. 如果用共享存儲,存儲必須負載羣集的節點上
9. 存儲的設備管理器和相應的適配器可以是 serial attached SCSI,Fibre Channel, Fibre Channel over Ethernet (FcoE), or iSCSI.
10. 計算集羣配置必須要通過配置嚮導的測試。

故障轉移集羣硬件需求和存儲選項

創建故障轉移集羣