登錄Zabbix,以及在Zabbix內創建一個系統用戶。html
用戶名:Admin 或者 admin
密碼 : zabbix前端
能夠在 管理(Administration) → 用戶(Users)下 查看用戶信息。數據庫
點擊 建立用戶(Create user) 以增長用戶。服務器
在添加用戶的表單中,確認將新增的用戶添加到了一個已有的用戶組,好比'Zabbix administrators'。網絡
默認狀況下,沒有爲新增的用戶定義媒介(media,即通知發送方式) 。如須要建立,能夠到 '媒介(Media)'標籤下,而後點擊 增長(Add)。dom
一個新用戶默認沒有權限訪問主機。在組(Groups)下,點擊用戶所在的組(這裏爲'Zabbix administrators'),爲用戶提高權限。在組的屬性表單下,點擊權限(Permissions)標籤。學習
爲了使這個用戶對Linux servers組擁有隻讀權限,點擊用戶組選擇欄位旁邊的選擇(Select)按鈕。spa
Zabbix中的主機(Host)是一個你想要監控的網絡實體(物理的,或者虛擬的)。Zabbix中,對於主機的定義很是靈活。它能夠時一臺物理服務器,一個網絡交換機,一個虛擬機或者一些應用。操作系統
Zabbix中,能夠經過配置(Configuration) → 主機(Hosts)菜單,查看已配置的主機信息。默認已有一個名爲'Zabbix server'的預先定義好的主機。但咱們須要學習如何添加另外一個。3d
點擊 建立主機(Create host)以添加新的主機,這將向咱們顯示一張主機配置表格。
至少須要填寫下列字段:
主機名稱(Host name)
輸入一個主機名稱,可使用字母數字、空格、點」.「、中劃線」-「、下劃線」_「。
組
從右邊的選擇框中,選擇一個或者多個組,而後點擊 « 移動它們到'所在組(In groups)'選擇框。
全部訪問權限都分配到主機組,而不是單獨的主機。這也是主機須要屬於至少一個組的緣由。
IP地址
輸入主機的IP地址。注意若是這是Zabbix server的IP地址,它必須是Zabbix agent配置文件中‘Server’參數的值。
暫時保持其餘選項的默認值。
當完成後,點擊添加(Add)。你能夠在主機列表中看到你新添加的主機。
若是可用性(Availability)列中的ZBX圖標是紅色的,通訊可能存在一些問題。將你的鼠標移動到上面查看錯誤信息。若是這個圖標是灰色的,說明目前狀態還沒更新。確認Zabbix server正在運行,同時過一下子刷新這個頁面。
監控項是Zabbix中得到數據的基礎。沒有監控項,就沒有數據——由於一個主機中只有監控項定義了單一的指標或者須要得到的數據。
主機包含了全部的監控項。若是須要配置一個監控項的示例,咱們須要前往 配置(Configuration) → 主機(Hosts) 並找到咱們已建立的'新主機(New host)'。
在'新主機(New host)'行中,監控項(Items)的連接旁的數量會顯示爲'0'。點擊這個連接,而後點擊創 建監控項(Create item),將會顯示一個監控項定義表格
對於監控項的示例,須要輸入如下必要的信息:
名稱(Name)
輸入 CPU Load 做爲值。在列表中和其餘地方,都會顯示這個值做爲監控項名稱。
值(Key)
手動輸入 system.cpu.load 做爲值。這是監控項的一個技術上的名稱,用於識別獲取信息的類型。這個特定值須要是Zabbix Agent預約義值重的一種。
信息類型(Type of information)
在此處選擇 Numeric (float)。這個屬性定義了想得到數據的格式。
你也須要減小監控項歷史保留的天數,7或者14天。對於數據庫而言,最佳實踐是避免數據庫保留過多的歷史數據。
當一個監控項定義完成後,你可能好奇它具體得到了什麼值。前往 監控(Monitoring) → 最新數據(Latest data),點擊- other -前面的 + ,而後查看你以前定義的監控項和得到的值。
同時,第一次得到的監控項值最多須要60秒才能到達。默認狀況下,這是服務器讀取變化後的配置文件,獲取並執行新的監控項的頻率。
若是你在‘變化(Change)’列中沒有看到值,可能到目前爲止只得到了一次值。等待30秒以得到新的監控項值。
若是你在當前界面中沒有看到監控項的信息,請確認:
你輸入的監控項'值(Key)' 和 '信息類型(Type of information)' 同截圖中的一致
agent和server都在運行狀態
主機狀態爲'監控(Monitored)'而且它的可用性圖標是綠色的
監控項處於啓用狀態
當監控項運行了一段時間後,能夠查看可視化圖表。 簡單圖表 適用於任何被監控的數值型(numeric)監控項,且不須要額外的配置。這些圖表會在運行時生成。
前往監控(Monitoring) → 最新數據(Latest data),而後點擊監控項後的'圖表(Graph)'連接以查看圖表。
監控項只是用於收集數據。若是須要自動評估收到的數據,咱們則須要定義觸發器。觸發器包含了一個表達式,這個表達式定義了數據的可接受的閾值級別。
若是收到的數據超過了這個定義好的級別,觸發器將被「觸發」,或者進入「異常(Problem)」狀態——從而引發咱們的注意,讓咱們知道有問題發生。若是數據再次恢復到合理的範圍,觸發器將會到「正常(Ok)」狀態。
爲監控項配置觸發器,前往 配置(Configuration) → 主機(Hosts),找到'新增主機(New host)',點擊旁邊的 觸發器(Triggers) ,而後點擊創 建觸發器(Create trigger)。這將會像咱們展示一個觸發器定義表單。
對於觸發器,有下列必填項:
名稱(Name)
輸入 CPU load too high on 'New host' for 3 minutes 做爲值。這個值會做爲觸發器的名稱被現實在列表和其餘地方。
表達式(Expression)
輸入:{New host:system.cpu.load.avg(180)}>2
值時觸發器的表達式。確認這個表達式輸入正確,包括全部的符號。此處,監控項值(system.cpu.load)用於指出具體的監控項。這個特定的表達式大體是說若是3分鐘內,CPU負載的平均值超過2,那麼就觸發了問題的閾值。你能夠查看更多的觸發器表達式語法信息。
完成後,點擊添加(Add)。新的觸發器將會顯示在觸發器列表中。
當一個觸發器定義完畢後,你可能想查看它的狀態。
前往 監控(Monitoring) → 觸發器(Triggers)以查看。3分鐘後(咱們須要等待3分鐘以評估這個觸發器的3分鐘平均值),觸發器會在這裏顯示。應該會有一個綠色的'OK'在'狀態(Status)'列中閃爍。
閃爍意味着這個觸發器狀態最近30分鐘內發生過變化。
若是此處出現一個閃爍的紅色'PROBLEM',顯然,這說明了CPU負載已經超過了你在觸發器裏定義的閾值級別。
當監控項收集了數據後,觸發器會根據異常狀態觸發報警。根據一些報警機制,它也會通知咱們一些重要的事件,而不須要咱們直接在Zabbix前端進行查看。
這就是通知(Notifications)的功能。E-mail是最經常使用的異常通知發送方式。咱們將會學習如何配置e-mail通知。
Zabbix中最初內置了一些預約義的通知發送方式。E-mail 通知是其中的一種。
前往 管理(Administration) → 媒體類型(Media types),點擊預約義媒體類型列表中的 Email,以 配置E-mail。
根據你的環境,設置SMTP服務器,SMTP helo, SMTP e-mail的值。
'SMTP email'將做爲Zabbix通知的'發件人(From)'地址。
一切就緒後,點擊 更新(Update)。
如今你已經配置了'Email'做爲一種可用的媒體類型。一個媒體類型必須經過發送地址來關聯用戶(如同咱們在配置一個新用戶]中作的]),不然它將沒法生效。 === 新建動做 === 發送通知是Zabbix中[[manual:config:notifications:action|動做(actions)執行的操做之一。所以,爲了創建一個通知,前往 配置(Configuration) → 動做(Actions),而後點擊 建立動做(Create action)。
在這個表單中,輸入這個動做的名稱。
{TRIGGER.STATUS} 和 {TRIGGER.NAME} 是宏(macros)或者變量,能夠在Default subject 和 Default message 區域查看。會以實際的觸發器狀態和觸發器名稱的值替代。
在大多數簡單的例子中,若是咱們不添加更多的指定條件,這個動做會在觸發器從 'Ok' 變爲 'Problem'是發生。
咱們還須要定義這個動做具體作了什麼 —— 即在 操做(Operations) 標籤頁中執行的操做。點擊新建(New),將會打開一個操做表單。
這裏,在發送給用戶(Send to Users)塊中點擊添加(Add),而後選擇咱們以前定義的用戶('user')。選擇'Email'做爲Send only to的值。完成後,在操做明細區域中,點擊添加(Add)。
這是一個簡單的動做配置步驟,即點擊動做表單中的添加(Add)。
如今,發送通知配置完成,咱們看看它如何將通知發送給實際接收人。爲了實現這個目的,咱們須要你主機的負載,這樣咱們的觸發器纔會被觸發,咱們會收到異常通知。
打開主機的控制檯,並運行:
cat /dev/urandom | md5sum
你須要運行一個或者多個這樣的進程。
如今,前往監控(Monitoring) → 最新數據(Latest data),查看'CPU Load'的值是否已經增加。記住,爲了使咱們的觸發器觸發(fire),'CPU Load'的值須要在在3分鐘運行的過程當中超過2。一旦知足這個條件:
在監控(Monitoring) → 觸發器(Triggers)中,你會看到這個觸發器的狀態呈現一個綠色閃爍的'Problem'
你的e-mail中,會收到一個異常通知
若是通知功能沒有正常工做:
再次驗證e-mail設置和動做設置已經被正確配置
確認你建立的用戶對生成事件的主機至少擁有讀(read)權限。正如添加用戶步驟中提到的,'Zabbix administrators'用戶組中的用戶必須對'Linux servers'主機組(該主機所屬組)至少擁有讀(read)權限。
另外,你能夠在報告(Reports) → 動做日誌(Action log)中檢查動做日誌。
開始使用模版,你必須先建立一個。在 配置(Configuration) → 模版(Templates)中,點擊 建立模版(Create template)。這將會像咱們展示一個模版配置表格。
須要輸入如下必填字段:
模版名稱(Template name)
輸入一個模版名稱。可使用數字、字母、空格及下劃線。
組(Groups)
從右邊的選擇框中選擇一個或者多個組,點擊 « 移動它們到'所在組(In groups)'選擇框。模版必須屬於至少一個組。
完成後,點擊添加(Add)。你新建的模版能夠在模版列表中查看。
你能夠在這看到模版信息。但這個模版中沒有任何信息——沒有監控項、觸發器活着其餘對象。
爲了在模版中添加監控項,前往'New host'的監控項列表。在配置(Configuration) → 主機(Hosts),點擊‘New host’旁邊的監控項(Items)。
而後:
選中列表中'CPU Load'監控項的選擇框
點擊列表下方的複製(Copy)
選擇想要複製這個監控項的目標模版
監控項源地址 → 複製到新地址(主機監控,模板監控項都行)
你如今能夠前往配置(Configuration) → 模版(Templates),'新模版(New template)'中會有一個新的監控項。
咱們目前至建立了一個監控項,但你能夠用一樣的方法在模版中添加其餘的監控項,觸發器以及其餘對象,直到完成知足特定需求(如監控OS,監控單個應用)的完整的對象組合。
準備一個模版後,將它連接到一個主機。前往 配置(Configuration) → 主機(Hosts),點擊'新主機(New host)'打開表單,前往模版(Templates)標籤頁。
點擊連接新模版(Link new templates)旁邊的選擇(Select),在彈出的窗口中,點擊咱們建立模版的名稱('New template'),它會出如今連接新模版(Link new templates)區域,點擊添加(Add)。這個模版會出如今已連接模版(Linked templates)列表中。
點擊更新(Update)保存配置。如今,新模版及其全部的對象被添加到了主機。
你可能會想到,咱們可使用一樣的方法將模版應用到其餘主機。任何在模版級別的監控項、觸發器及其餘對象的變動,也會傳遞給全部連接該模版的主機。
連接預約義模版到主機
你可能注意到,Zabbix爲各類操做系統、設備以及應用準備一些預約於的模版。爲了快速部署監控,你可能會將它們中的一些與主機關聯。但請注意,一些模版須要根據你的實際環境進行合適的調整。好比:一些檢查項是不須要的,一些輪詢週期過於頻繁。
-- 衣帶漸寬終不悔,爲伊消得人憔悴。---