IBM X系列服務器經過sysmgmt接口查看日誌


    IBM服務器出現一些故障時。除了面板外,還能夠經過sys mgmt接口來查看ibm服務器硬件日誌。服務器

IBM X系列服務器提供了Integrated Management Module(IMM)集成管理模塊,能夠比較方便的監控服務器健康情況,查看日誌信息,還提供了一些配置管理功能。微信

    在IBM X系列服務器背板上有一個「SYS MGMT」接口,IMM的默認管理地址就是「192.168.70.125/24」用網線將此接口與筆記本鏈接起來,而後將筆記本的IP地址配置成「192.168.70.0/24」這個網段的地址,而後PING測試「192.168.70.125」,若是能通就OK了。,而後在IE地址欄輸入「http://192.168.70.125」,而後出來如下界面:默認用戶名:USERID密碼:PASSWORD網絡

 

輸入用戶名口令:USERID/PASSW0RD,注意是數字「0」不是英文字母「o」。ide

 

點「continue」,測試

 

在「system status」能夠查看系統的健康情況,若是系統正常則顯示綠色指示燈, 若是有錯誤則顯示×××燈,並會列出是什麼錯誤。spa

 

 

「vitual light path」指示燈狀態3d

 

 

這裏是服務器日誌信息模塊,記錄了錯誤日誌,警告日誌和信息日誌信息,能夠幫助工程師方便的定位故障。日誌

 

在「network interfaces」裏能夠對網絡接口進行配置,修改管理地址等操做。orm

 



下面是IBM對面板說明:視頻

IBM服務器診斷面板

1、IBM X3650 M3診斷面板位置:

 

 

 

30ce44a8c39a13335f47d990e40992d9.png-wh_

1a4bdf7ca3e01c5bce2f1c0d231cc9ba.png-wh_

 

 

 

說明:

 

  電源控制按鈕和供電指示燈按下此按鈕可手動開啓和關閉服務器,或喚醒處於省電

  狀態下的服務器。供電指示燈的狀態以下所示:

 

  A、熄滅:未接通交流電,或者電源或指示燈自己出現故障。

 

  B、快速閃爍(每秒四次):服務器已關閉,但未準備就緒,沒法開啓。電源控制按鈕已禁用。服務器接通交流電源後大約三分鐘,電源控制按鈕便會激活。

 

  C、緩慢閃爍(每秒一次):服務器已關閉,而且已準備就緒,能夠開啓。您能夠按電源控制按鈕以開啓服務器。

 

  D、點亮:服務器開啓。

 

  E、逐漸變暗直至熄滅:服務器處於省電狀態。要喚醒服務器,請按電源控制按鈕或使用IMM Web 界面。

 

 

標註:若是該指示燈熄滅,並不表示服務器中不存在電流。該指示燈可能已燒燬。要切斷服務器中的全部電流,必須從電源插座斷開電源線。

 

 

  ●以太以太網圖標指示燈:該指示燈點亮以太網圖標。

 

  ●以太網活動指示燈: 若是這些指示燈中任意一個點亮,表示服務器正在向鏈接到對應

     於該指示燈的以太網端口的以太網LAN 發送信號,或正在接收來自該以太網LAN

     的信號。

 

  ● 信息指示燈:當該指示燈點亮時,表示發生了通常性事件。光通路診斷面板上的某

      個指示燈也會點亮,以幫助找出錯誤。

 

  ●系統錯誤指示燈:當該指示燈點亮時,表示發生了系統錯誤。光通路診斷面板上的

      某個指示燈也會點亮,以幫助找出錯誤。

 

  ●釋放滑鎖:將該滑鎖滑向左側可操做光通路診斷面板,該面板位於操做員信息面板

      的後面。

 

  ●定位器按鈕和定位器指示燈:使用該指示燈可用肉眼在其餘服務器中找到該服務

      器。它還可用於證實受信平臺模塊(Trusted Platform Module,TPM)的物理存在。

      按下此按鈕可從本地開啓或關閉該指示燈。可使用IBM Systems Director 來遠程

      點亮該指示燈。

 

 

 

 

 

 

2、IBM X3650 M3診斷面板顯示信息。

 

 

465a2a97719a5f742d00e9c04ae2854d.png-wh_

 

 

指示燈

狀態

問題

操做

BRD

 

亮燈

主板上發生錯誤。

 

一、檢查主板上的指示燈,肯定引發錯誤的組件。在下列狀況下, BRD 指示燈可能會點亮:

  ●電池

   ●缺乏PCI 轉接卡組合件

   ● 穩壓器發生故障

二、查看系統事件日誌,獲取有關錯誤的信息。

三、更換全部發生故障的可更換組件或安裝缺乏的可更換組件,如 電池或PCI 轉接卡組合件。

四、若是穩壓器發生故障,請更換主板。

CNFG

亮燈

發生硬件配置錯誤。


CPU

亮燈

當只有CPU 指示燈點亮時,才表示微處理器發生故障。

當CPU 指示燈和CNFG 指示燈都點亮時,表示微處理器配置無效。

一、肯定CNFG 指示燈是否也點亮。若是CNFG 指示燈不亮,表示微處理器發生故障。

二、若是CNFG 指示燈點亮,表示微處理器配置無效。

DASD

亮燈

發生硬盤驅動器錯誤。硬盤驅動器發生故

障或缺失。

 

一、 檢查硬盤驅動器上的指示燈以找出狀態指示燈點亮的那個驅動 器,而後從新安裝該硬盤驅動器。

二、從新安裝硬盤驅動器底板。

三、若是該錯誤仍然存在,請按所示順序更換如下組件:

     a、 更換硬盤驅動器。

     b、更換硬盤驅動器底板

FAN

亮燈

風扇發生故障,或者是運行過慢,或者是已卸下風扇。TEMP 指示燈可能也會點亮。

一、從新安裝由主板上風扇接口附近點亮的指示燈所指示的故障風

扇。

二、更換由主板上風扇接口附近點亮的指示燈所指示的故障風扇。

LOG

亮燈

已將錯誤消息寫入系統事件日誌

查看IMM 系統事件日誌和系統錯誤日誌,獲取有關錯誤的信息。更換錯誤日誌中指出的全部組件。

MEM

亮燈

當只有MEM 指示燈點亮時,才表示發生了內存錯誤。

當MEM 指示燈和CNFG 指示燈都點亮時,表示內存配置無效。

 

一、肯定CNFG 指示燈是否也點亮。若是是,請運行內存測試試驗程序以肯定問題。

a、 若是測試報告有內存錯誤發生,請更換由主板上點亮的指示燈所指示的故障DIMM。

b、若是測試報告內存配置無效,請將DIMM 從新插入具備受支持配置的插槽中。

二、若是CNFG 指示燈不亮,那麼應該出現瞭如下某種狀況:

a、 服務器未引導且DIMM 故障指示燈點亮。

b、查看系統事件日誌(SEL)中是否存在PFA 日誌事件。

c、從新安裝DIMM。

d、若是問題仍然存在,請將DIMM 移到其餘插槽中。

e、若是主板上與這個新DIMM 插槽對應的DIMM 指示燈點亮,請更換DIMM。

f、若是主板上與原DIMM 插槽對應的DIMM 指示燈點亮,請更換主板(僅限通過培訓的技術服務人員)。

g、 服務器已引導,發生故障的DIMM 被禁用且其對應的指示燈點亮。

h、若是兩個DIMM 對應的指示燈都點亮,請查看系統事件日誌以找出有關其中一個DIMM 的PFA,而後更換該DIMM。不然,請同時更換這兩個DIMM。

i、若是隻有一個DIMM 對應的指示燈點亮,請更換該DIMM。

j、在服務器固件設置中從新啓用DIMM 插槽。

NMI


發生不可屏蔽的中斷,或按下了NMI 按鈕。

查看系統事件日誌,獲取有關錯誤的信息。

OVER SPEC


因爲某個電源通道上出現電源超負荷狀況,因此關閉了服務器。電源功率超過最大額定值。


PCI


PCI 總線或主板上發生錯誤。發生故障的PCI 插槽旁的附加指示燈點亮。

 

一、檢查PCI 插槽上的指示燈,肯定致使錯誤的 組件。

二、查看系統事件日誌,獲取有關錯誤的信息。

三、若是沒法經過指示燈和系統事件日誌中的信息肯定發生故障的適配器,請從發生故障的PCI 總線上逐個卸下適配器,而且每卸下一個適配器都從新   啓動一次服務器。

PS


電源發生故障。

一、檢查電源指示燈以瞭解是否有錯誤指示(交 流電源指示燈和直流電源指示 燈未同時點亮)。

二、確保發生故障的電源已正確安裝到位。

三、更換髮生故障的電源。

 

RAID


RAID卡發生故障

RAID卡有錯誤信息或RAID卡有硬件錯誤

SP


服務處理器(IMM)發生故障。

一、 切斷服務器的電源;而後將服務器從新鏈接到電源並從新啓動服務器。

二、 更新IMM 上的固件。

TEMP


系統溫度已超出閾值級別。發生故障的風扇會致使TEMP 指示燈點亮。

 

一、查看錯誤日誌,以肯定在哪裏測得溫度太高狀況。若是風扇發生故障,請進行更換。

二、確保室溫不會過高。瞭解溫度信息。

三、確保通風孔未堵塞。

 

 

 

  標註:

 

    REMIND 按鈕:按下此按鈕可從新設置操做員信息面板上的系統錯誤指示燈並將服務器置於提醒方式。在提醒方式下,

  故障並無清除但系統錯誤指示燈會閃爍(每2 秒閃爍一次)而不是持續發亮;若是出現另外一個系統錯誤,則系統錯誤指示燈將會持續發亮。


微信掃一掃 、關注公衆號

   不定時分享資料視頻

20191030160339365.jpg

相關文章
相關標籤/搜索