Prometheus 編寫告警規則案例

Prometheus 編寫告警規則案例node

:確保alertmanager配置完畢!vim

一、建立編輯文件:vim /usr/local/prometheus/rules/node.yml測試

# groups:組告警
groups:
# name:組名。報警規則組名稱
- name: general.rules
  # rules:定義角色
  rules:
  # alert:告警名稱。 任何實例5分鐘內沒法訪問發出告警
  - alert: NodeFilesystemUsage
    # expr:表達式。 獲取磁盤使用率 大於百分之80 觸發
    expr: 100 - (node_filesystem_free_bytes{mountpoint="/",fstype=~"ext4|xfs"} / node_filesystem_size_bytes{fstype=~"ext4|xfs"} * 100) > 80
    # for:持續時間。 表示持續一分鐘獲取不到信息,則觸發報警。0表示不使用持續時間
    for: 1m
    # labels:定義當前告警規則級別
    labels:
      # severity: 指定告警級別。
      severity: warning
    # annotations: 註釋 告警通知
    annotations:
      # 調用標籤具體指附加通知信息
      summary: "Instance {{ $labels.instance  }} :{{ $labels.mountpoint }} 分區使用率太高" # 自定義摘要
      description: "{{ $labels.instance  }} : {{ $labels.job  }} :{{ $labels.mountpoint  }} 這個分區使用大於百分之80% (當前值:{{ $value }})" # 自定義具體描述

二、檢查並從新加載配置文件spa

./promtool check config prometheus.yml
kill -hup 11853

三、控制檯查看配置code

四、調整閥值測試報警 調整到1%。   把配置文件的80改爲1就行 - -。 而後記得再從新加載配置。blog

:能夠配置多個監控須要配置配置文件配置多個 -alert:。ip

相關文章
相關標籤/搜索