Prometheus Node_exporter 之 Basic CPU / Mem / Disk Gauge

1. CPU Busy :收集全部 cpu 內核 busy 狀態佔比


type: Singlestat
Unit: perent(0-100)
(全部 cpu使用狀況 - 5分鐘內 cpu 空閒的平均值) / 全部 cpu使用狀況
metrics:

(((count(count(node_cpu_seconds_total{instance=~\"$node:$port\",job=~\"$job\"}) by (cpu))) - avg(sum by (mode)(irate(node_cpu_seconds_total{mode='idle',instance=~\"$node:$port\",job=~\"$job\"}[5m])))) * 100) / count(count(node_cpu_seconds_total{instance=~\"$node:$port\",job=~\"$job\"}) by (cpu))

最大值: 100%

node

2. Used RAM Memory free -m


type: Singlestat
Unit: perent(0-100)
已使用的內存佔比(包括Buffer緩存和Cached緩存)
metrics:

((node_memory_MemTotal_bytes{instance=~\"$node:$port\",job=~\"$job\"} - node_memory_MemFree_bytes{instance=~\"$node:$port\",job=~\"$job\"}) / (node_memory_MemTotal_bytes{instance=~\"$node:$port\",job=~\"$job\"} )) * 100


node_memory_MemFree_bytes 空閒內存

已使用的內存佔比(不包括Buffer緩存和Cached緩存)
metrics:

100 - ((node_memory_MemAvailable_bytes{instance=~"$node:$port",job=~"$job"} * 100) / node_memory_MemTotal_bytes{instance=~"$node:$port",job=~"$job"})

MemAvailable: Free + Buffers + Cached - 不可回收的部分。不可回收部分包括:共享內存段,tmpfs,ramfs等

緩存

3. Used SWAP: 交換分區使用率


type: Singlestat
Unit: perent(0-100)
metrics:

((node_memory_SwapTotal_bytes{instance=~\"$node:$port\",job=~\"$job\"} - node_memory_SwapFree_bytes{instance=~\"$node:$port\",job=~\"$job\"}) / (node_memory_SwapTotal_bytes{instance=~\"$node:$port\",job=~\"$job\"} )) * 100

node_memory_SwapFree_bytes 交換分區的空閒大小spa

 

4. Used Root FS 根文件系統使用率


type: Singlestat
Unit: perent(0-100)
metrics:

100 - ((node_filesystem_avail_bytes{instance=~"$node:$port",job=~"$job",mountpoint="/",fstype!="rootfs"} * 100) / node_filesystem_size_bytes{instance=~"$node:$port",job=~"$job",mountpoint="/",fstype!="rootfs"})

node_filesystem_avail_bytes 文件系統可用空間內存

 

5. CPU System Load (1m avg) 一分鐘內 CPU 全部內核的平均負載率


type: Singlestat
Unit: perent(0-100)
metrics:

avg(node_load1{instance=~"$node:$port",job=~"$job"}) / count(count(node_cpu_seconds_total{instance=~"$node:$port",job=~"$job"}) by (cpu)) * 100

node_load1 : 系統一分鐘內的負載it

 

 

6. CPU System Load (5m avg) 五分鐘內 CPU 全部內核的平均負載率


type: Singlestat
Unit: perent(0-100)
metrics:

avg(node_load5{instance=~"$node:$port",job=~"$job"}) / count(count(node_cpu_seconds_total{instance=~"$node:$port",job=~"$job"}) by (cpu)) * 100

node_load5 : 指5分鐘內cpu的負載sed

1. CPU Busy :收集全部 cpu 內核 busy 狀態佔比



type: Singlestat
Unit: perent(0-100)
(全部 cpu使用狀況 - 5分鐘內 cpu 空閒的平均值) / 全部 cpu使用狀況
metrics:

(((count(count(node_cpu_seconds_total{instance=~\"$node:$port\",job=~\"$job\"}) by (cpu))) - avg(sum by (mode)(irate(node_cpu_seconds_total{mode='idle',instance=~\"$node:$port\",job=~\"$job\"}[5m])))) * 100) / count(count(node_cpu_seconds_total{instance=~\"$node:$port\",job=~\"$job\"}) by (cpu))


最大值: 100%

file

2. Used RAM Memory free -m



type: Singlestat
Unit: perent(0-100)
已使用的內存佔比(包括Buffer緩存和Cached緩存)
metrics:

((node_memory_MemTotal_bytes{instance=~\"$node:$port\",job=~\"$job\"} - node_memory_MemFree_bytes{instance=~\"$node:$port\",job=~\"$job\"}) / (node_memory_MemTotal_bytes{instance=~\"$node:$port\",job=~\"$job\"} )) * 100


node_memory_MemFree_bytes 空閒內存

已使用的內存佔比(不包括Buffer緩存和Cached緩存)
metrics:

100 - ((node_memory_MemAvailable_bytes{instance=~"$node:$port",job=~"$job"} * 100) / node_memory_MemTotal_bytes{instance=~"$node:$port",job=~"$job"})


MemAvailable: Free + Buffers + Cached - 不可回收的部分。不可回收部分包括:共享內存段,tmpfs,ramfs等

cpu

3. Used SWAP: 交換分區使用率



type: Singlestat
Unit: perent(0-100)
metrics:

((node_memory_SwapTotal_bytes{instance=~\"$node:$port\",job=~\"$job\"} - node_memory_SwapFree_bytes{instance=~\"$node:$port\",job=~\"$job\"}) / (node_memory_SwapTotal_bytes{instance=~\"$node:$port\",job=~\"$job\"} )) * 100


node_memory_SwapFree_bytes 交換分區的空閒大小filesystem

4. Used Root FS 根文件系統使用率



type: Singlestat
Unit: perent(0-100)
metrics:

100 - ((node_filesystem_avail_bytes{instance=~"$node:$port",job=~"$job",mountpoint="/",fstype!="rootfs"} * 100) / node_filesystem_size_bytes{instance=~"$node:$port",job=~"$job",mountpoint="/",fstype!="rootfs"})


node_filesystem_avail_bytes 文件系統可用空間文件

5. CPU System Load (1m avg) 一分鐘內 CPU 全部內核的平均負載率



type: Singlestat
Unit: perent(0-100)
metrics:

avg(node_load1{instance=~"$node:$port",job=~"$job"}) / count(count(node_cpu_seconds_total{instance=~"$node:$port",job=~"$job"}) by (cpu)) * 100


node_load1 : 系統一分鐘內的負載

6. CPU System Load (5m avg) 五分鐘內 CPU 全部內核的平均負載率

type: SinglestatUnit: perent(0-100)metrics: avg(node_load5{instance=~"$node:$port",job=~"$job"}) / count(count(node_cpu_seconds_total{instance=~"$node:$port",job=~"$job"}) by (cpu)) * 100 node_load5 : 指5分鐘內cpu的負載

相關文章
相關標籤/搜索