環境:HPUX 11.31;ServiceGurad A.11.20。2個node:node1,node2;一個package:pkg1.node
主機:BL860c i4app
故障現象:pkg1能夠正常的在兩個node之間切換,可是當其中一個node關機後,pkg1切到node2上只能運行1分鐘左右,以後便會自動failed。ide
分析過程:ci
1.檢查了pkg1的log,系統的syslog,均未發現異常。it
2.檢查配置在pkg控制文件裏的應用腳本,未發現異常。爲了方便排查,暫時將定義在control文件裏的應用腳本註釋掉。class
3.註釋掉以後,故障現場仍然存在。肩擦包配置文件,包控制文件,依然沒有什麼發現。集羣
4.檢查集羣配置文件,和以往本身作的集羣配置文件進行對比,發現客戶的集羣配置文件裏多了SUBNET配置和IP_MONITOR配置。懷疑是監控
此緣由,故將其註釋,以下:配置
#SUBNET 10.73.0.0方法
# IP_MONITOR OFF
# POLLING_TARGET 10.73.0.1
5.從新check,apply集羣配置文件後,故障解決。
總結:通過查證,在集羣配置文件裏(通常爲cluster.ascii)不須要寫SUBNET參數(在pkg配置文件裏寫入MONITORED_SUBNET便可),也不須要IP_MONITOR參數,若是寫了SUBNET,則必定要把IP_MONITOR 設置爲OFF。
對於這種故障,解決方法爲:A.註釋掉集羣配置文件裏的SUBNET參數和IP_MONITOR參數。2.若是不註釋,在必定要把IP_MONITOR配置爲OFF。推薦方法A。IP監控的配置在包配置文件裏能夠定義,不用再在集羣裏定義。