使用Prometheus監控snmp

獲取snmp信息

首先獲取須要監控的snmp的基本信息,假設基本信息以下:mysql

snmp服務IP: 1.1.1.1
snmp community: public
snmp exportor部署地址: 2.2.2.2

配置snmp exporter

官方下載snmp exporter的可執行文件。git

此外還須要本身編譯生成snmp exporter的配置文件,首先須要配置generator.yml文件,而後按照BuildingRunning中的步驟編譯生成snmp.yml。generator.yml文件的配置能夠參考File Format。generator.yml文件中只須要注入snmp的community便可,下面僅修改了modules.if_mib.auth字段,其他與File Format中一致。github

modules:
  # Default IF-MIB interfaces table with ifIndex.
  if_mib:
    walk: [sysUpTime, interfaces, ifXTable]
    version: 2
    auth:
      community: public
    lookups:
      - source_indexes: [ifIndex]
        lookup: ifAlias
      - source_indexes: [ifIndex]
        lookup: ifDescr
      - source_indexes: [ifIndex]
        # Use OID to avoid conflict with Netscaler NS-ROOT-MIB.
        lookup: 1.3.6.1.2.1.31.1.1.1.1 # ifName
        ...

生成新的snmp.yml以後替換原有的snmp.yml便可。sql

配置Prometheus

Prometheus的最小配置以下,增長一個snmp的job便可,params.module中能夠配置須要抓取的模塊,不配置表示所有抓取。shell

global:
  scrape_interval: 1m
  scrape_timeout: 60s
  evaluation_interval: 20s
scrape_configs:
  - job_name: 'snmp'
    static_configs:
      - targets:
        - 1.1.1.1
    metrics_path: /snmp
#    params:
#      module: [if_mib]
    relabel_configs:
      - source_labels: [__address__]
        target_label: __param_target
      - source_labels: [__param_target]
        target_label: instance
      - target_label: __address__
        replacement: 2.2.2.2:9116

啓動snmp exporter和Prometheus便可curl

grafana配置

snmp給出了snmp服務所在的節點(通常爲交換機)的接口信息,如接口狀態,名稱,In/Out報文數目,丟棄報文數和錯誤報文數等。下面給出簡單的配置:ui

計算接收的報文總數lua

sum(ifHCInBroadcastPkts+ifHCInMulticastPkts+ifHCInUcastPkts)by(ifDescr)

計算2分鐘內接收到的報文總數的平均數url

sum(rate(ifHCInBroadcastPkts[2m])+rate(ifHCInMulticastPkts[2m])+rate(ifHCInUcastPkts[2m]))by(ifDescr)

計算髮送的報文總數debug

sum(ifHCOutBroadcastPkts+ifHCOutMulticastPkts+ifHCOutUcastPkts)by(ifDescr)

計算2分鐘內發送的報文總數的平均數

sum(rate(ifHCOutBroadcastPkts[2m])+rate(ifHCOutMulticastPkts[2m])+rate(ifHCOutUcastPkts[2m]))by(ifDescr)

計算未上送的報文總數

sum(ifInDiscards+ifInErrors+ifInUnknownProtos)by(ifDescr)

計算2分鐘內未上送的報文總數的平均數

sum(rate(ifInDiscards[2m])+rate(ifInErrors[2m])+rate(ifInUnknownProtos[2m]))by(ifDescr)

計算丟棄的報文總數

sum(ifOutDiscards+ifOutErrors)by(ifDescr)

計算2分鐘內丟棄的報文總數的平均數

sum(rate(ifOutDiscards[2m])+rate(ifOutErrors[2m]))by(ifDescr)

計算GigabitEthernet0/27接口上2分鐘內的入流量變化,單位Mbps

(rate(ifHCInOctets{ifDescr="GigabitEthernet0/27"}[2m])*8)/(1024*1024)

計算GigabitEthernet0/27接口上2分鐘內的出流量變化,單位Mbps

(rate(ifHCOutOctets{ifDescr="GigabitEthernet0/27"}[2m])*8)/(1024*1024)

下圖給出了2分鐘內的入流量的變化曲線

TIPS

snmp exporter中有一些相似的監控指標如ifHCInBroadcastPkts和ifInBroadcastPkts,使用Prometheus監控時推薦使用帶HC的,如ifHCInBroadcastPkts,ifHCInMulticastPkts,由於帶HC的比不帶HC的能表示更大長度的數據。具體緣由參見這裏

Debug

能夠在2.2.2.2機器上使用以下命令查看snmp_exporter是否部署正確

curl http://127.0.0.1:9116/snmp?target=1.1.1.1
相關文章
相關標籤/搜索