Open-falcon是由小米公司開源php
好比windows,linux,unix,openBSD,AIX,solaris,Mac等操做系統,均可以安裝
Zabbx客戶端佔用的系統資源不多。能夠獲取CPU,內存。網卡。磁盤,目志等信息
經過SNMP不只僅能夠監控網絡設備,也能夠監控打印機。存儲,UPS
基本上只要聯網的設備均可以經過SNMP監控
支持經過IPMI酸取硬件的溫度。風扇。硬盤。電源等java
IPMI(智能平合管理接口)是一個開放的硬件管理接口標準。
經過ipmi不只能夠獲取監控數據,還能夠管理硬件設備,重啓,關機,獲取硬件日誌等等,
有的服務不支持客戶端安裝。同時也不支持SNMP
這類服務咱們能夠經過Zabbx自帶的檢測進行監控
支持TCP,ICMP,SSH,Telnet檢測方式
Zabb安特自定義監控。經過shell,python,rulby,perl,powershll 任何可執行的腳本收集監控數據,
默認Zabbix提供URL監控,可使用該功能監控線上的業務是否正常。異常響應或者沒有四配的關鍵字及時告警
python
好比監控到Nginx服務宕了。那麼最早要作的不是查看他爲何宕了,而是要快速啓動它。讓他繼續提供服務
Zabbix支持8種運算符。29個函數能夠住意組合使用。徹底能夠知足咱們的告警閥值設置需求,
通常的監控系統都是監控數據達到了設定的閥值纔會觸發告警操做。Zabbix一樣支持該設置
但Zabbix更注重故障預警,就是在故障發生前通知相關負責人或者進行相關操做
這樣就能夠有效避免故障的發生。Zalbbx主要經過趨勢分析來判斷數據將來的走勢
若趨勢異常則會觸發告警操做
Zabbx還支持和歷史數據進行對比分析,如和上週的數據對此分析
若是有異常一樣觸發告警
線上的監控數據不必定是穩定的。不少時候是有波動的。面對這種狀況,通常是取一段時間的平均值做爲告警的值。或者一段時間內觸發了閾值的次數,雖然上面的辦法能夠下降告警數量。提升有效性。可是以告警的及時性來換取的,Zabbx能夠經過波動範圍來解決。就是說只要你的數據在這個範圍內波動,那麼就是正常狀況。超過這個範圍纔會觸發告警
linux
能夠發送消息通知負責人。郵件。短信。電話。微信。釘釘你想到的均可以
消息通知這只是最基本的功能。Zabbix還能夠在告警觸發時執行命令或者腳本
這麼作的主要目的就是快速恢復業務。然局再查問題緣由
好比監控到Nginx服務宕了。不須要先查爲何宕,先作的是快速啓動。繼續提供服務
Zabbix還能夠實現告警操做升級。
仍是以Nginx服務宕爲例。開始已經發送消息通知負責人。並執行了重啓的命令
過了5分鐘發現業務依然沒有恢復,這時候能夠進行告警升級。如通知領導。發送電話語音告警給負責人等
這樣事件就升級了。讓相關的人都關注到而且及時處理。
不少人都遇到過告警風暴。短期內幾百上千條告警信息一塊兒涌來
技術人員要從這些告警信息中找出很本的緣由須要花費必定的時間
後來就有了告警聚合和關聯
Zabbb提供了告警關聯分析功能,能夠有效下降告警風暴,同時讓技術人員只關注事件的根本緣由,沒有告警美聯,一合服務器上面運行了多個服務。當服務器宕機的時候,上面運行的服務告警也會發送,
若是將服務的監控和服務器宕機作個關聯,那麼當機器宕機時,只有宕機的信息會發送,其餘服務的告警信息指揮顯示在前段頁面
技術人員從這麼多信息中看到服務器宕機的那個告警。恍然大悟。原來是它致使的正則表達式
Zabbx支持多種認證方式,能夠是本地用戶。HTTP基礎認證,LDAP認證
不一樣的用戶登陸能夠設置不一樣的權限。能夠查看哪些機器。 機器有讀權限。哪些機器有讀寫權限
對安全性要求高的話。Zabbx任意兩個組件之間均可以經過TLS加密傳輸數據
這種設置通常是多地域。多機房的狀況會用到。避免數據在傳輸過程當中被竊聽或者德改
TLS全稱是Transport Layer Security 傳輸層安全性協議, 而SSL是TLS的前身。SSL3.0當時被發現能夠被收擊不夠安全,因此在SSL 3.0的基礎上創建了TLS 1.0shell
有海量設備須要監控時,靠人工是很低效的。須要自動化實現設備監控備
針對相似場景。Zabbix提供2個自動化手段來幫助技術人員高效管理設備監控
第一個是網絡掃描。經過掃描發現網段中知足條件的設備。好比安裝了agent,打開了SNMP.開啓了特定的服務知足條件的這些設備能夠設置操做自動加入監控。應用對應的監控模板。或者是執行某個處理腳本
第二個是Agent自動註冊。只要是安裝了agent的設備而且配置爲主動上報模式。Zabbix服務端會根據客戶端傳過來的信息執行監控相關操做。
以上兩個功能能夠大幅下降人爲的操做。提升監控的自動他和完整性
網卡流量,掛載的文件系統等等,這些信息不一樣的設備可能徹底不同
這就用到Zabbx的LLD低級自動發視的功能了數據庫
這兩個功能能夠大幅度下降人爲的操做,操做監控的自動化和完整性,
網卡流量。掛載的文件系統等等,這些信息不一樣的設備可能徹底不同
這就用到Zabbix的LLD低級自動發現的功能了
低級發現功能能夠自動發現並建立監控項,告警策略。圖表
像上面提到的文件系統,網卡經過該功能能就被Zabbix服務端發現並添加至監控了vim
歷史數據支持和kafka.Hadoop.ES等組件進行聯動
客戶端新增Http類型監控,能夠獲取Restful接口的監控數據
標籤功能在用戶權限。告警處理等功能中獲得了支持
還能和企業的單點登陸系統結合到一塊兒windows
Poller進程主要負責Server主動拉取類型的監控數據
Trapper進程主要負責Agent主動上報的監控數據
Http Poller進程主要負責URL監控類型的數據收集
icmp pinger進行負責ping存活監控數據收集
Java gateway進程負責和java gateway通訊處理數據
Java poller進程負責拉取JMX類型數據獲取
ipmi poller進程負責IPMI類型數據獲取
timer進程負責處理和時間有關的數據以及告警
vmware collector 進行收集vmware虛擬環境監控數據
unreachalble Poller負責處理沒法到達類的監控處理
preprocessing進程會對監控數據進行預處理
服務端的history Syncer選程負責將數據分析並保存至數據庫中
housekeeper程負責按期清理歷史數據
告警是經過alerter進程處理髮送的。而alerter manager是負責管理alerter進程的
escalaitor選程是負責處理告警過程當中的各個步驟的。比有告警升級之類的
分佈式通訊是由proxy poller選程負責的
discovery process是負責設備自動發現功能的安全
禁用防火牆
systemctl disable firewalld.service
命令行補全
yum install bash-completion
yum install bash-completion-extras
windows端安裝並做爲一個服務啓動
windows端查進程
查看日誌
監控數據的查看
中文亂碼的問題
複製windows中的中文字體
cp /tmp/msyh.ttf /usr/share/zabbix/fonts
編輯php文件
vim include/defines.inc.php
將其中的兩項關於font名字的參數改爲複製的字體名字
觸發器函數
linux配置郵件服務器
依賴 mailx 包 須要安裝 yum install mailx
編輯配置文件
vim /etc/mail.rc
添加163郵箱配置信息
測試發送消息
配置zabbix的告警腳本路徑
編寫一個執行腳本
接受三個參數
這個腳本執行下來告警信息將做爲一個附近來發送郵件
改進
dos2linux 將附件中的數據提取出來做爲字節流寫入郵件
yum install dos2unix
zabbix配置
添加動做
宏
全局宏 模板宏 用戶自定義宏 變量的生效範圍跟代碼的使用同樣,
當在表達式中使用到宏變量的時候,zabbix會先去本地尋找, 優先級: 自定義>模板宏>全局宏,最後都找不到zabbix就講顯示這個宏的名稱 {$xxxxxx},當同級有重名的宏變量,zabbix的處理方式是使用最早定義的,後面定義的不會覆蓋以前的,
模板宏
能夠和過濾器一塊兒使用,知道一個正則表達式中
全局宏的使用
使用正則進行判斷輸出
用戶自定義宏
自動發現規則 LLD
實例:自動發現端口並監控起來
在用戶自定義鍵中添加key及調用的腳本
查看端口信息
腳本篩選出要的信息
腳本
測試腳本
建立自動發現規則
定義自動發現規則
提示:通常zabbix跑起來使用的是zabbix用戶,但有時候zabbix用戶掉不起來一些須要的權限,能夠在配置中修改容許root用戶,
zabbix_get 測試
規則建立成功
定義監控項原型
觸發器原型