初識 prometheus

初識 prometheus

prometheus是什麼及其主要功能注意事項

prometheus 是什麼?

我如今目前的讀者都確定經過prometheus這個監控吧,那麼它究竟是什麼呢? prometheus是一個基於時間序列(time_series)的監控軟件,它是由soundCloud開源監控告警解決方案,從2012年開始編寫代碼,再到2015年github上開源,已經不少大公司使用,2016年prometheus成爲繼kubernetes後,第二個CNCF(cloud native Computing Foundation雲原生計算基金會)的成員。2017年末發佈了基於全新存儲層的2.0版本,能更好地與容器平臺、雲平臺配合,並同時支持告警。node

prometheus的主要功能

  • 多維數據模型(時序由metrics[指標]和k/v的labels構成)
  • 靈活的查詢語句(PromQL)支持基本數據運算和函數
  • 無依賴存儲,支持local和remote不一樣的模型
  • 採用http協議,使用pull/push模式來獲取數據
  • 監控目標,能夠採用服務發現和靜態配置的方式
  • 支持多種統計數據模型,配合grafana使用圖形化友好

prometheus的核心組件

  • prometheus server:主要對獲取的數據和存儲時序數據,另外還提供查詢和alert rule(報警規則)配置管理
  • client libraries:用於對接prometheus server,能夠查詢和上報數據
  • Pushgateway: 用於批量,短時間的監控數據的彙總節點,監控主機上報給pushgeateway,而後pushgateway上報給prometheus sever。
  • exporters: 各類彙報數據的exporters,例如彙報機器數據的node_exporter,彙報docker狀況的cAdvisor
  • alertmanager: 用於告警通知的

prometheus基礎架構圖

下面這張圖是官方的架構圖
image.pngios

從上圖中咱們也能看出來prometheus的主要包含的模塊,pushgateway,exporters,retrieval,TSDB(存儲)HTTP,PromeQl,Alertmanager。git

他的大體邏輯是這樣的:
1,prometheus會按期從靜態配置的targets或者服務發現的targets中向部署在被監控端的服務器上請求exporters來獲取數據,或者由客戶端經過定時任務按期向pushgateway發送數據,而後有pushgateway向prometheus發送數據。
2,當新的數據大於配置內存緩存區的時候,prometheus會將數據持久化到磁盤,(若是使用remote storage將持久到雲端)
3,prometheus能夠配合grafana經過特定的表達是來獲取咱們想要的監控圖形
4,prometheus能夠配置rules(規則),而後定時查詢數據,當出發告警條件的時候,會通知alertmanager推送到配置的告警信息上去
4,alertmanager收到告警信息的時候,能夠根據配置,聚合,去重,降噪最後發送警告github

promethesus使用的注意事項

  • prometheus的數據是基於時間序列(time-series)的fload64的值,
  • prometheus不適合作審計計費,由於他的數據是按照時間間隔來採集的,關注的更可能是系統的運行的瞬時狀態以及趨勢,即便有少許的數據沒有采集也能容忍,可是審計計費須要記錄每一個請求,而且數據長期存儲,這個prometheus沒法知足。

prometheus和其餘監控的對比

prometheus相對於其餘軟件的優點

1,易於管理
prometheus核心部分只有一個單獨的用golang編寫的二進制文件,不存在任何的第三方依賴(數據庫,緩存等)。惟一須要作的就是本地磁盤和內存,因此他能夠運行在各類平臺。
prometheus是基於pull和push模型的架構方式,在任何地方搭建咱們的監控系統,對於一些複雜的狀況,還可使用prometheus服務發現(server Discovery)的能力動態管理監控目標。golang

2,監控服務的內部運行狀態
prometheus鼓勵用戶監控服務的內部狀態,基於prometheus豐富的client庫,用戶能夠輕鬆的在應用程序中添加的對prometheus的支持,從而讓用戶能夠獲取服務和應用內部真正的運行狀態。docker

3,強大的數據模型
全部採集的監控數據均以指標(metric)的形式保存在內置的時間序列數據庫當中(TSDB)。全部的樣本除來基本的指標名稱之外,還包含一組用於描述該樣本特徵的標籤。數據庫

4,強大的查詢語言PromQL
prometheus內置來一個強大的數據查詢語言promQL,經過PromQL能夠實現對監控數據的查詢/聚合。同時PromeQL也被應用於數據可視化(grafana)以及告警中。緩存

5,高效
對於監控系統而言,大量的監控任務必然致使有大量的數據產生。而Prometheus能夠高效地處理這些數據,對於單一Prometheus Server實例而言它能夠處理:服務器

  • 數以百萬的監控指標
  • 每秒處理數十萬的數據點。

6,可擴展性
Prometheus是如此簡單,所以你能夠在每一個數據中心、每一個團隊運行獨立的Prometheus Sevrer。Prometheus對於聯邦集羣的支持,可讓多個Prometheus實例產生一個邏輯集羣,當單實例Prometheus Server處理的任務量過大時,經過使用功能分區(sharding)+聯邦集羣(federation)能夠對其進行擴展。網絡

7,易於集成
由於prometheus採用的是http的協議來進行通訊獲取數據的,因此全部語言只要支持http協議均可以被看成exporters來使用

8,可視化
prometheus配合grafana制定精美的監控圖表

prometheus VS zabbix

  • Zabbix 使用的是 C 和 PHP, Prometheus 使用 Golang, 總體而言 Prometheus 運行速度更快一點。
  • Zabbix 屬於傳統主機監控,主要用於物理主機,交換機,網絡等監控,Prometheus 不只適用主機監控,還適用於 Cloud, SaaS, docker,kubernetes,Container 監控。
  • Zabbix 在傳統主機監控方面,有更豐富的插件。
  • Zabbix 能夠在 WebGui 中配置不少事情,可是 Prometheus 須要手動修改文件配置。

prometheus vs nagios

  • Nagios 數據不支持自定義 Labels, 不支持查詢,告警也不支持去噪,分組, 沒有數據存儲,若是想查詢歷史狀態,須要安裝插件。
  • Nagios 是上世紀 90 年代的監控系統,比較適合小集羣或靜態系統的監控,顯然 Nagios 太古老了,不少特性都沒有,相比之下Prometheus 要優秀不少。

prometheus vs InfluxDB

  • InfluxDB 是一個開源的時序數據庫,主要用於存儲數據,若是想搭建監控告警系統, 須要依賴其餘系統。
  • InfluxDB 在存儲水平擴展以及高可用方面作的更好, 畢竟核心是數據庫。
相關文章
相關標籤/搜索