SCOM管理包對象詳解

 *更多關於SCOM的詳細內容,請關注個人資料*算法


SCOM是經過管理包和代理共同完成被監視設備(被監視的設備也稱之爲SCOM代理)的性能和事件的收集,因此要讓SCOM啓動對服務器的監視,首先須要完成兩個步驟:數據庫

  1. 下載、解壓並在SCOM管理控制檯將SCOM管理包導入SCOM運行數據庫。服務器

  2. 在要監視的服務器上安裝SCOM代理。網絡

安裝在服務器上的SCOM代理和SCOM服務器之間構建起全部監視信息傳遞的通道,或者也能夠理解成橋樑。該通道的做用以下:分佈式

  1. 負責分發SCOM策略給被監視的設備,好比開啓或關閉某個組件的監視,監視頻率的更改等。ide

  2. 傳遞由SCOM發起的操做指令,好比Ping代理服務器、遠程桌面鏈接代理、列出代理服務器進程和服務、遠程執行代理的PowerShell命令、性能

  3. 負責傳輸從被監視的服務器上收集的事件和性能。spa

     只有代理,SCOM還沒法收集事件和性能數據了,由於,SCOM代理並不知道要在哪些服務器上收集、收集哪些性能和事件數據、用什麼樣的頻率進行收集,以及收集後如何歸總和展示性能視圖等等。要完成這些,必需要導入SCOM管理包,使用管理包中預約義的策略進行性能和事件的收集、歸總和展示。操作系統

 微軟免費提供不少管理包,包括微軟本身和其餘廠商的系統和應用。管理包中具有如下對象幫助咱們收集和展示系統和應用的性能:代理

 

對象發現

一臺服務器安裝操做系統後,會有很是多的組件,若是再安裝不一樣的林林總總的應用,SCOM怎麼知道要收集哪些組件的性能或者事件呢?因此管理包第一步也是關鍵的一步就是經過管理包定義要收集哪些組件的性能和事件(也即MIB庫),好比導入Windows Server管理包能夠發現CPU/內存/網卡/系統等,導入SQL Server管理包就能發現SQLServer的服務和組件……SCOM代理攜帶這些MIB信息就能識別出被監視服務器的組件。舉個例子,Windows Server Operating System管理包將發現類型爲WindowsServer 2008(R2)/2012(R2)/2016 的全部組件,包括內存、CPU、磁盤、網卡、系統等。默認狀況下,對象發現有開啓也有關閉的,如圖1所示。

 wKiom1jsr7yySyg2AAEmss8_Bys375.jpg-wh_50

1

若是默認關閉,就意味着即便導入了管理包沒法發現這個對象裏,好比CPU對象發現是默認關閉的,那麼咱們即便導入了Windows Server Operating System管理包也沒法監視CPU的活動和性能,後面的性能收集也就無從下手了,這時須要手動開啓CPU的對象發現。這也就是爲何CPU、硬盤的性能默認是沒法收集的,由於SCOM根本沒有發現服務器上的CPU和硬盤,還怎麼監視呢?還有種請況就是SCOM默認發現週期很長,好比Exchange Server CAS對象須要導入Exchange Server 管理包後24小時以後才能被SCOM發現,因此用戶安裝SCOM管理包之後,也要等24小時才能看到Exchange Server CAS的狀態。

管理包中的對象發現是隻讀的,意味着咱們不可在SCOM控制檯新建本身的對象發現,由於管理包已經限定了對象發現範圍,咱們只能修改對象發現,好比開啓關閉發現,修改發現週期等。

 

性能/事件收集規則

SCOM自己不定義性能計數器,而是使用設備/系統/應用現有的計數器,好比Windows Server 內存計數器等等,這些計數器信息跟隨導入的管理包存放在SCOM運行數據庫中,只不過SCOM管理包裏不會包含全部的性能計數器,所以SCOM數據庫也不會存放全部的性能計數器,這也是爲何有時候咱們找不到一些計數器,於是沒法收集到某些性能。此時,咱們須要自行添加計數器並插入到SCOM運行數據庫裏。規則裏包含了要收集哪一種對象(硬件、系統、數據庫仍是應用)、這個對象的版本、收集哪一個性能和收集頻率,好比一個名爲Memory\% Committed Bytes In Use Windows Server 2012的規則將收集服務器的內存對象,版本爲Windows Server 2012系統,收集頻率爲10分鐘,計數器使用% Committed Bytes In Use。

      默認狀況下,管理包並不會開啓全部的規則,這也是咱們在SCOM控制檯裏默認沒法看到某些性能結果,即便這個組件已經開啓了對象發現,如圖2所示。

 wKioL1jssAzAcIYDAAFnjyoYejw636.jpg-wh_50

圖2

 

若是要啓用未被啓用的規則,咱們須要經過替代規則的方式將其啓用。爲何叫替代呢?由於導入的SCOM管理包一般是封裝過的,是隻讀的,裏面的全部屬性和設置都不能直接在現有管理包中修改,而是經過將屬性和設置複製出來進行修改,而後存放到未封裝的管理包(咱們本身能夠在控制檯建立的管理包),再插入到SCOM運行數據庫。一般替代的規則比默認規則優先級高,好比邏輯磁盤可用空間規則的默認收集頻率是10分鐘,替代後的收集頻率爲5分鐘,那麼SCOM5分鐘收集一次邏輯磁盤可用空間。

管理包中的規則是可讀寫的,意味着咱們既可在SCOM控制檯新建本身的規則,也能夠修改(其實是替代)規則,好比開啓關閉規則,修改發現週期等。

 

性能/事件監視器

SCOM監視器能夠用來評估被監控對象的不一樣的情況和狀態。好比,監視器能夠用來評估性能計數器的值、事件生成、日誌文件裏面的數據生成、Windows服務器狀態、SNMP陷阱跟蹤。監視器和規則相同之處在於,它們都借用相同的計數器和事件日誌進行事件和性能的監視。二者不一樣的是,監視器能夠定義性能告警或者嚴重告警閾值,設置告警出發條件而且定義告警信息,以及設置事件恢復操做,而規則更傾向於收集,而且用在後續的任務中(好比自定義性能視圖、服務級別跟蹤等)。監視器能夠向上進行樹狀聚合,好比一個父監視器由4個子監視器報告的狀態聚合,4個子監視器分別監視不一樣的目標,這4個子監視器監視的對象是互相依賴的關係或者,因此4個子監視器報告的狀態決定着父監視器的狀態,如圖3所示。

 wKiom1jssDqjDb-gAADDV_awK_E349.jpg-wh_50

3

 

     子級單元監視器-父級聚合監視器這種結構中,父級聚合監視器的狀態由SCOM管理包提供不一樣的算法得到,而算法又由實際對象之間依賴關係的親疏決定,一般算法有如下幾類,如圖4、圖5和圖6所示:

  1. 子級單元監視全都正常,父級監視器才報告正常;

  2. 子級單元監視只要有一個正常,父級監視器報告爲正常;

  3. 要求有必定的比例的子監視器正常,父級監視器才報告爲正常。

 wKiom1jssFzC4SGdAABjeKNGEaY672.jpg-wh_50

4

  wKioL1jssF3BN2fzAABg87sWLcU385.jpg-wh_50

5

 wKiom1jssF3hLn-UAAB2Wga2ZjQ270.jpg-wh_50

6

 

爲了給你們進一步的說明,咱們舉個例子,5個子單元監視器監視分別監視一個羣集中的5個節點的可用性,若是節點出現不可用的狀況時監視器就觸發告警,由於羣集仲裁能夠保證最多2個節點同時故障,因此父聚合算法能夠遵循羣集的仲裁機制,保證只要報告服務器不可用的子單元監視器不超過2個,父聚合監視器的狀態就報告爲正常。

多個父監視器狀態還能夠繼續向上聚合,造成一個更爲豐富的樹狀監視結構,這種模型更加利於綜合性歸總監控,如圖7所示。

 wKioL1jssJSh2kioAAE-3IQpcaw548.jpg-wh_50

7

 

和對象發現以及規則同樣,默認狀況下,管理包並不會開啓全部的監視器,這也是咱們在SCOM控制檯裏默認沒法看到某些性能結果,即便這個組件已經開啓了對象發現,也開啓了規則,可是仍是沒法觸發監視告警。

咱們能夠自建本身的監視器,在監視器裏指定如下屬性:

  1. 收集哪些設備/系統/應用的性能或者事件

  2. 要使用哪一個計數器進行收集

  3. 收集哪一類日誌

  4. 設置告警閾值和警告/錯誤觸發條件

  5. 設置收集頻率

    若是要啓用未被啓用的監視器,咱們須要經過替代監視器的方式將其啓用,方法和規則替代同樣,再也不贅述。

 

服務級別跟蹤

在導入的管理包後,某些應用程序會自帶服務等級對象(SLO),這些SLO咱們能夠經過報表來展現他們在某段時間的可用性、停機、維護模式停機、未被監控的情況。一般咱們會設置某個應用程序、主機或分佈式應用程序在一段時間以內可用性的目標值(也即咱們所說的SLA),好比設定郵件系統或者Web服務器在一個月的可用時間至少爲99.99%,而後經過SCOM的監控來跟蹤郵件系統或者Web服務器在這個月實際的可用時間並經過報表展示真實值,將這兩個值進行對比得到的數值差就是域控制器服務級別的體現。

SCOM管理包對象中具有2種不一樣的SLO,分別是:

  1. 監視器狀態,收集服務器的可用性,如圖8所示

  2. 收集規則,設置性能閾值,監視服務器性能在閾值以內的時間,如圖9所示。

 wKiom1jssJXRelmTAAC4GJUu91g190.jpg-wh_50

圖8

 wKiom1jssJaD6W1QAACktMZhKmc916.jpg-wh_50

 9  

 

建立好服務級別跟蹤對象後,SCOM視圖並不會默認展示出來,而是須要經過報表或者自定義視圖將服務級別跟蹤調出來。

 

任務

SCOM具有一些遠程和控制代理的任務,這些任務針對不一樣的對象進行不一樣的操做,好比針對網絡設備有網絡設備的一些操做,針對系統有系統的操做。SCOM默認的任務將隨着管理包的導入一塊兒導入到SCOM數據庫,好比Windows Server Operating System管理包裏有針對磁盤有碎片整理、chkdsk、chkntfs以及獲取卷信息的任務,針對系統有啓動服務、啓動計算機、ping、ipconfig、路由打印等任務。咱們能夠在代理出現問題的時候,使用SCOM任務在SCOM服務器上進行遠程調試。

 

視圖

SCOM視圖是SCOM監視的展示元素,在SCOM控制檯的監視窗口中,能夠看到各類默認視圖,都是在SCOM管理包中定義的。一般這些視圖插入到SCOM運行數據庫之後咱們沒法修改默認視圖的結構和配置,如圖10所示。可是咱們能夠新建視圖結構和具體的視圖。

 wKioL1jssNHBHOLaAAD70YUkZhY234.jpg-wh_50

圖10

 

替代

從官方獲取的SCOM管理包一般都是封裝過的,沒法直接更改管理包裏面的對象發現、規則和監視器,而是要用替代的方法進行修改。替代其實是複製屬性以後,保存到未封裝的管理包中,在插入到SCOM運行數據庫裏。咱們能夠在SCOM管理包對象的替代裏查看全部被替代過的項目,這裏彙總了全部被替代的項目條目,如圖11所示。只要在這裏雙擊替代的項目,就能夠查看替代過的具體信息而且能夠進一步修改。

 wKiom1jssOTz2-5xAAEOm5VT7rg811.jpg-wh_50

11

相關文章
相關標籤/搜索