(一)系統環境描述瀏覽器
本文檔基於RHEL6u5 系統安裝,配置爲2節點高可用集羣,節點爲兩臺VMware虛擬機。服務器
也可參考http://blog.51cto.com/ty1992/1325327工具
(二)RHEL6-HA集羣安裝前準備url
1、節點本地hosts解析配置3d
在各集羣節點上配置本地hosts,添加節點信息。rest
2、配置本地yum安裝源blog
在集羣各節點上配置本地yum安裝源。ip
3、關閉系統防火牆、SELinux及NetworkManager服務ci
在集羣各節點上關閉系統防火牆服務,關閉NetworkManager服務,關閉SELinux。資源
(三)RHEL6-HA集羣程序組件安裝及啓動
1、集羣主程序組件安裝
在集羣各節點上執行yum命令安裝高可用組件。
yum groupinstall 「High Availability」
2、集羣管理程序組件安裝
在集羣各節點上執行yum命令安裝高可用管理工具組件。
3、啓動集羣管理程序服務
若爲rhel5,則首先初始化,設置用戶及密碼
/usr/sbin/luci_admin init
Service luci restart
使用 admin/888888登錄
在集羣各節點上啓動ricci服務。
修改集羣各節點ricci用戶密碼。
在其中一個節點上啓動luci服務。
命令顯示能夠經過此節點的url地址也網頁方式訪問集羣管理工具。
(四)RHEL6-HA集羣配置
1、登陸集羣配置管理工具
使用瀏覽器訪問上述啓動luci服務的集羣配置管理工具頁面,使用root用戶及密碼登陸配置管理工具。
首次登陸,會彈出如下警告信息,點擊OK完成登陸。
2、建立集羣
點擊左側邊欄「Manage Clusters」進入集羣管理配置,再次點擊「Create」建立集羣。
填寫節點與其餘信息,並點擊「Create Cluster」建立集羣。
其中「Cluster Name」爲集羣名稱;「Node Name」爲集羣節點名稱,須要和節點hosts文件中保持一致,「Password」爲節點ricci用戶的密碼,其餘保持默認。
頁面自動跳轉並提示正在建立集羣,建立完成後顯示以下信息。
3、添加節點Fence設備
點擊「Fence Devices」並點擊「Add」添加設備。
在設備列表中選擇「VMware Fencing (SOAP Interface)」。點擊「Submit」提交。
其中「Name」爲設備名稱,IP地址爲VMware虛擬化環境中的vCenter系統IP地址,「Login」爲登陸vCenter的用戶,「Password」爲相應vCenter用戶的密碼。
建議在vCenter系統中單首創建一個做爲集羣Fence設備的用戶,並使該用戶對集羣各節點的虛擬機具備開機、關機、重啓等基本權限。
查找虛擬機UUID信息。
使用fence_vmware_soap命令來查找相應集羣節點虛擬機的UUID信息。
命令顯示該用戶有權查看的全部虛擬機的UUID信息。
點擊「Nodes」並點擊template1-hb節點進入Fence設備關聯配置。
點擊「Add Fence Method」添加對應Fence設備。
其中「VM name」爲虛擬機名稱,「VM UUID」爲虛擬機的UUID信息,勾選「Use SSL」,點擊「Submit」提交。
點擊「Nodes」並點擊template2-hb節點進入Fence設備關聯配置。按照上述步驟爲第二個節點關聯Fence設備。
4、建立故障切換域
點擊「Failover Domains」進入故障切換域配置,點擊「Add」建立。
配置信息後點擊「Create」建立。
其中「Name」爲故障切換域名稱,兩個節點的優先級設爲1和10,數字越小表示優先級越高。
5、集羣資源建立
點擊「Resources」並點擊「Add」增長資源。
在資源下拉列表中選擇。依次按須要建立IP地址、文件系統、應用腳本三個集羣資源。
IP地址資源:
文件系統資源:
腳本資源:
三個資源建立完成。
6、服務建立
點擊「Service Groups」並點擊「Add」增長服務。集羣保護的服務由若干個集羣資源組成,並屬於一個故障切換域,該服務能夠在此故障切換域中的節點上切換。
定義相關信息後點擊「Add Resource」添加資源。
在服務中,包含三個資源:IP、Filesystem、Script;這三個資源具有必定的依賴關係,在集羣配置中能夠用Clild Resource的方式指定這種依賴關係,經常使用的依賴關係是:
IP -> Filesystem -> Script
服務啓動的時候,會先啓動IP,而後掛載文件系統,最後用腳本啓動服務,反之亦然。
在資源列表中先選擇IP地址資源;
而後點擊「Add Child Resource」添加一個子資源,也就是文件系統資源;再點擊「Add Child Resource」 添加最後一個資源,也就是腳本資源。資源添加完畢,點擊「Submit」提交。
資源添加完畢,集羣保護的「App」服務正常啓動。集羣配置完成。
(五)集羣管理經常使用命令
1、查看集羣狀態
執行命令clustat能夠查看當前集羣狀態。
Member Name顯示集羣節點名,此集羣有兩個節點。
Status表示集羣節點的狀態,Online表示集羣節點是正常在線狀態。
Service Name表示集羣資源服務名,此處顯示集羣資源服務名稱爲App。
Owner表示集羣資源服務運行在哪一個節點上,此處顯示App運行在template1-hb節點上。
State表示集羣資源服務運行狀態,此處顯示集羣資源服務是已啓動狀態。
2、關閉集羣中的資源組
clusvcadm -d App命令表示關閉集羣資源服務App。意味着App服務所包含的浮動IP、文件系統、程序腳本都將中止。
3、啓動集羣中的資源組
clusvcadm -e App命令表示啓動集羣服務App。意味着App服務所包含的浮動IP、文件系統、程序腳本都將依次啓動。
4、集羣資源組切換
clusvcadm -r App命令表示手動將集羣資源服務App從當前節點切換到另外一個節點上。
5、離線集羣節點
若是要對集羣中的某臺服務器進行硬件維護或停機,能夠先將集羣服務在該服務器上中止,而後對該服務器關機或維護。若是資源正運行在該服務器上,那麼資源將自動切換到另一臺服務器上,若是該服務器沒有運行資源,那麼該操做對於集羣中的資源沒有影響。
執行service rgmanager stop 命令關閉資源組服務。
執行service cman stop 命令關閉集羣服務。
命令執行完畢後,使用clustat命令顯示集羣狀態,該節點應顯示爲「offline」。
6、上線集羣節點
執行service cman start 命令啓動集羣服務。
執行service rgmanager start 命令啓動資源組服務。
命令執行完畢後,使用clustat命令顯示集羣狀態,該節點應顯示爲「online」。