基於Prometheus和Grafana的監控平臺 - 環境搭建

時間 2019-11-24

標籤基於 prometheus grafana 監控平臺環境搭建简体版

原文原文鏈接

環境準備

在開始配置以前請下載如下幾個軟件(直接從github或者grafana官網下載太慢了，簡直是龜速並且容易下載失敗，建議使用迅雷下載)。服務器

安裝

準備兩臺服務器，一臺用做安裝prometheus和grafana，一臺用做放置exporter組件。創建應用文件夾，將相關軟件上傳至服務器。

192.168.249.131 prometheus，grafana
192.168.249.129 exporter

prometheus

使用以下shell命令進行安裝並啓動

tar zxvf prometheus-2.13.1.linux-amd64.tar.gz
mv prometheus-2.13.1.linux-amd64 prometheus
cd prometheus
nohup ./prometheus &

啓動完成後，用瀏覽器打開http://192.168.249.131:9090進行訪問，效果以下：

grafana

使用以下shell命令進行安裝並啓動

tar grafana-6.4.3.linux-amd64.tar.gz
cd grafana-6.4.3
nohup ./grafana-server &

啓動完成後，用瀏覽器打開http://192.168.249.131:3000進行訪問，默認帳號密碼爲admin/admin，初次登錄須要修改密碼，修改密碼並登錄效果以下：

node_exporter

使用以下shell命令進行安裝並啓動

tar zxvf node_exporter-0.18.1.linux-amd64.tar.gz
mv node_exporter-0.18.1.linux-amd64 node_exporter
nohup ./node_exporter &

node exporter默認使用9100端口，可使用--web.listen-address=":9200"指定端口號。
啓動完成後，用瀏覽器打開http://192.168.249.129:9100/進行訪問,顯示效果以下：

配置

prometheus

進入prometheus安裝目錄，修改prometheus.yml文件，增長監聽job server-192.168.249.129，完整配置以下：

# my global config
global:
  scrape_interval:     15s # Set the scrape interval to every 15 seconds. Default is every 1 minute.
  evaluation_interval: 15s # Evaluate rules every 15 seconds. The default is every 1 minute.
  # scrape_timeout is set to the global default (10s).

# Alertmanager configuration
alerting:
  alertmanagers:
  - static_configs:
    - targets:
      # - alertmanager:9093

rule_files:
  # - "first_rules.yml"
  # - "second_rules.yml"


scrape_configs:
  # The job name is added as a label `job=<job_name>` to any timeseries scraped from this config.
  - job_name: 'prometheus'
    static_configs:
    - targets: ['localhost:9090']

  - job_name: '192.168.249.129'
    static_configs:
    - targets: ['192.168.249.129:9100']

配置完成後重啓prometheus，查看監聽狀態。