1服務器集羣簡介
注意:有關安裝
羣集服務器的信息,請參閱
Windows server 2003產品家族的幫助和部署指南。
關於Windows Server 2003的企業版和Datacenter版均可以支持最大達8個節點的集羣配置;其典型的特徵是可爲數據庫、消息系統、文件與打印服務這些關鍵業務應用,提供高可用性和可擴展性,在集羣中的多個服務器(節點)保持不間斷的聯繫。便是說若是在集羣中的某一節點因出錯或維護不可用時,另外一節點會馬上提供服務,以實現容錯。正在訪問服務的用戶能夠繼續訪問,而不會察覺到服務已經由另外一臺服務器(節點)提供。
[2]
2建立羣集
在
服務器羣集產品中含有用來在服務器上安裝羣集軟件和建立新羣集的羣集安裝實用工具。建立新羣集時,首先在選擇做爲羣集的第一個成員的計算機上運行該實用工具。第一步是肯定羣集名稱並建立羣集數據庫和初始的羣集成員列表來定義新羣集。 Windows server 2003 羣集新增了一個羣集管理設置嚮導以及使用 cluster.exe
命令行界面建立( 包括從遠程建立 )羣集的功能。
建立羣集的最後一步是,在另外將要成爲羣集成員的每一臺計算機上運行安裝實用工具。每當將新節點添加到羣集中時,新節點都會自動從羣集的原始成員得到現有羣集數據庫的副本。當節點加入或造成羣集時,羣集服務會更新該節點私有的配置數據庫副本。
3造成羣集
若是服務器運行了羣集服務而且沒法找到羣集中的其它節點,它本身能夠造成一個羣集。要造成羣集,節點必須可以得到對
仲裁資源的獨佔權。
當最初造成羣集時,羣集中的第一個節點將包括羣集配置數據庫。每當有新節點加入羣集時,新節點都會在本地得到並保持羣集配置數據庫的副本。
仲裁資源用恢復日誌(其中含有同節點無關的羣集配置和狀態數據)的形式存儲配置數據庫的最新版本。
在羣集運行中,羣集服務使用仲裁恢復日誌執行如下操做 :
保證只有一組活動、可相互通信的節點才能造成羣集
僅當某個節點能夠得到對
仲裁資源的控制權時 , 才容許它造成羣集
4集羣服務的狀態
從羣集中的其它節點和羣集服務管理接口的角度看,當造成羣集時,羣集中的每一個節點可能處於三種不一樣狀態中的一種。事件處理器會記錄這些狀態,而事件日誌管理器會將這些狀態複製到羣集的其它節點。羣集服務狀態包括:
脫機。此時的節點不是徹底有效的羣集成員。該節點及其
羣集服務器可能在運行,也可能未運行。
聯機。此時的節點是徹底有效的羣集成員。它聽從羣集數據庫的更新、對仲裁算法施加本身的影響、維護心跳通信,並能夠擁有和運行資源組。
暫停。它只能支持它當前已擁有的那些資源組。之因此提供暫停狀態,是爲了容許執行某些維護。大多數
服務器羣集組件會將聯機和暫停視爲等價的狀態。
5優點
2、
集羣系統可解決
軟件系統問題,咱們知道,在
計算機系統中,用戶所使用的是
應用程序和數據,而應用系統運行在操做系統之上,操做系統又運行在服務器上。這樣,只要應用系統、操做系統、服務器三者中的任何一個出現故障,系統實際上就中止了向
客戶端提供服務,好比咱們常見的軟件
死機,就是這種狀況之一,儘管服務器
硬件無缺,但服務器仍舊不能向客戶端提供服務。而集羣的最大優點在於對故障服務器的監控是基於應用的,也就是說,只要服務器的應用中止運行,其它的相關服務器就會接管這個應用,而沒必要理會應用中止運行的緣由是什麼。
3、
集羣系統能夠解決人爲失誤形成的應用系統中止工做的狀況,例如,當管理員對某臺服務器操做不當致使該服務器停機,所以運行在這臺服務器上的應用系統也就中止了運行。因爲集羣是對應用進行監控,所以其它的相關服務器就會接管這個應用。
6缺點
咱們知道集羣中的應用只在一臺服務器上運行,若是這個應用出現故障,其它的某臺服務器會從新啓動這個應用,接管位於共享磁盤櫃上的數據區,進而使應用從新正常運轉。咱們知道整個應用的接管過程大致須要三個步驟:偵測並確認故障、後備服務器從新啓動該應用、接管共享的數據區。所以在切換的過程當中須要花費必定的時間,原則上根據應用的大小不一樣切換的時間也會不一樣,越大的應用切換的時間越長。
7加入羣集
尋找
若是一個服務器要加入現有羣集 , 則它必須運行羣集服務而且必須成功找到羣集中的其它節點。在找到其它節點後,加入的服務器必須接受羣集成員資格驗證,並得到羣集配置數據庫的副本。
條件
加入現有羣集的過程開始於 Windows Server 2003 或 Windows 2000 Service Control Manager 在
節點上啓動羣集服務之時。在啓動過程當中,羣集服務會配置並裝入該節點的本地數據設備。它並不會試圖將共用的羣集數據設備做爲節點聯機,由於現有羣集可能正在使用這些設備。
過程
爲了查找其它節點 , 會啓動一個發現過程。當節點發現任何羣集成員時,它將執行
身份驗證序列。第一個羣集成員會對新加入者進行
身份驗證,而且在新服務器獲得成功驗證後返回成功狀態。若是驗證不成功(未能識別待加入節點的羣集成員身份,或者它使用了無效的賬戶密碼),則加入羣集的請求會被拒絕。
驗證
進行成功驗證後,首先聯機的羣集節點會檢查加入節點上的配置數據庫副本。若是該副本已過期,對加入服務器進行驗證的羣集節點會爲加入的服務器發送該數據庫的更新副本。剛加入羣集的節點在收到複製的數據庫後,能夠用它查找共享資源並根據須要將它們聯機。
8脫離羣集
當節點關閉或羣集服務被中止時,節點可能脫離羣集。但當節點不執行羣集操做(好比不向羣集配置數據庫提交更新)時,節點也可能被迫脫離(被逐出)羣集。
若是節點根據預先的計劃脫離羣集,它會向其它全部節點成員發送 ClusterExit 消息,通知它們它將脫離羣集。該節點不等待任何響應就會當即進行關閉資源和全部羣集鏈接的操做。因爲其他
節點收到了退出消息,所以它們不會執行在節點意外失效或網絡通信中止時發生的從新分組過程以從新確立羣集成員身份。
9方法
有兩種經常使用的服務器集羣方法,一種是將備份服務器鏈接在主服務器上,當主服務器發生故障時,備份服務器才投入運行,把主服務器上全部任務接管過來。另外一種方法是將多臺服務器鏈接,這些服務器一塊兒分擔一樣的應用和數據庫計算任務,改善關鍵大型應用的響應時間。同時,每臺服務器還承擔一些容錯任務,一旦某臺服務器出現故障時,系統能夠在
系統軟件的支持下,將這臺服務器與系統隔離,並經過各服務器的負載轉嫁機制完成新的負載分配。
PC服務器中較爲常見的是兩臺服務器的集羣,UNIX系統可支持8臺服務器的
集羣系統,
康柏的專用系統OpenVMS可支持多達96臺服務器的集羣系統。
10集羣的特色
在
集羣系統中,全部的計算機擁有一個共同的名稱,集羣內任一系統上運行的服務可被全部的網絡客戶所使用。集羣必須能夠協調管理各分離組件的錯誤和失敗,並可透明的向集羣中加入組件。用戶的公共數據被放置到了共享的磁盤櫃中,
應用程序被安裝到了全部的服務器上,也就是說,在集羣上運行的應用須要在全部的服務器上安裝一遍。當
集羣系統在正常運轉時,應用只在一臺服務器上運行,而且只有這臺服務器才能操縱該應用在共享磁盤櫃上的數據區,其它的
服務器監控這臺服務器,只要這臺服務器上的應用中止運行(不管是
硬件損壞、操做系統
死機、應用軟件
故障,仍是人爲誤操做形成的應用中止運行),其它的服務器就會接管這臺服務器所運行的應用,並將共享磁盤櫃上的相應數據區接管過來。其接管過程以下圖所示(以應用A爲例):
1.應用A正常工做時;
2.應用A中止工做後,其它的備用服務器將該應用接管過來。 具體接管過程分三部執行: a.系統接管 b.加載應用 c.客戶端鏈接
11集羣技術的分類
-
高可用集羣高可用集羣的英文全稱是High Availability,簡稱HA cluster。高可用的含義是最大限度地可使用。從集羣的名字上能夠看出,此類集羣實現的功能是保障用戶的應用程序持久、不間斷地提供服務。
-
負載均衡集羣負載均衡集羣也是由兩臺或者兩臺以上的服務器組成。分爲前端負載調度和後端服務兩個部分。負載調度部分負載把客戶端的請求按照不一樣的策略分配給後端服務節點,然後端節點是真正提供養分程序服務的部分。與HA Cluster不一樣的是,負載均衡集羣中,全部的後端節點都處於活動動態,它們都對外提供服務,分攤系統的工做負載。
-
科學計算集羣高性能計算集羣,簡稱HPC集羣。這類集羣致力於提供單個計算機所不能提供的強大計算能力,包括數值計算和數據處理,而且傾向於追求綜合性能。HPG與超級計算相似,可是又有不一樣,計算速度是超級計算追求的第一目標。最快的速度、最大的存儲、最龐大的體積、最昂貴的價格表明瞭超級計算的特色。隨着人們對計算速度需求的提升,超級計算也應用到各個領域,對超級計算追求單一計算速度指標轉變爲追求高性能的綜合指標,即高性能計算