HP-UX MC/SG報錯一例分享

環境:HPUX 11.31;ServiceGurad A.11.20。2個node:node1,node2;一個package:pkg1.node

 

主機:BL860c i4app

 

故障現象:pkg1能夠正常的在兩個node之間切換,可是當其中一個node關機後,pkg1切到node2上只能運行1分鐘左右,以後便會自動failed。ide

 

分析過程:ci

 

        1.檢查了pkg1的log,系統的syslog,均未發現異常。it

 

        2.檢查配置在pkg控制文件裏的應用腳本,未發現異常。爲了方便排查,暫時將定義在control文件裏的應用腳本註釋掉。class

 

        3.註釋掉以後,故障現場仍然存在。肩擦包配置文件,包控制文件,依然沒有什麼發現。集羣

 

        4.檢查集羣配置文件,和以往本身作的集羣配置文件進行對比,發現客戶的集羣配置文件裏多了SUBNET配置和IP_MONITOR配置。懷疑是監控

 

此緣由,故將其註釋,以下:配置

 

#SUBNET 10.73.0.0方法

#  IP_MONITOR OFF

#  POLLING_TARGET 10.73.0.1 

 

       5.從新check,apply集羣配置文件後,故障解決。

 

總結:通過查證,在集羣配置文件裏(通常爲cluster.ascii)不須要寫SUBNET參數(在pkg配置文件裏寫入MONITORED_SUBNET便可),也不須要IP_MONITOR參數,若是寫了SUBNET,則必定要把IP_MONITOR 設置爲OFF。

 

      對於這種故障,解決方法爲:A.註釋掉集羣配置文件裏的SUBNET參數和IP_MONITOR參數。2.若是不註釋,在必定要把IP_MONITOR配置爲OFF。推薦方法A。IP監控的配置在包配置文件裏能夠定義,不用再在集羣裏定義。

相關文章
相關標籤/搜索