阿里雲監控項解析

阿里雲監控

1、CPU 相關監控項

  • 可參考Linux的top命令來理解各項指標含義。
監控項名稱 監控項含義 單位 說明
Host.cpu.idle 當前空閒CPU百分比 % 當前CPU處於空閒狀態的百分比
Host.cpu.system 當前內核空間佔用CPU百分比 % 指系統上下文切換的消耗,該監控項數值比較高,說明服務器開了太多的進程或者線程
Host.cpu.user 當前用戶空間佔用CPU百分比 % 用戶進程對CPU的消耗
Host.cpu.iowait 當前等待IO操做的CPU百分比 % 該項數值比較高說明有很頻繁的IO操做
Host.cpu.other 其餘佔用CPU百分比 % 其餘消耗,計算方式爲(Nice + SoftIrq + Irq + Stolen)的消耗
Host.cpu.totalUsed 當前消耗的總CPU百分比 % 指以上各項CPU消耗的總和,一般用於報警

2、內存相關監控項

  • 可參考free命令來理解各項指標含義。
監控項名稱 監控項含義 單位 說明
Host.mem.total 內存總量 bytes 服務器的內存總量
Host.mem.used 已用內存量 bytes 用戶程序使用的內存 + buffers + cached,buffers爲緩衝區佔用的內存空間,cached爲系統緩存佔用的內存空間
Host.mem.actualused 用戶實際使用的內存 bytes 計算方法1. (used - buffers - cached)計算方法2. (total - available) Centos 7.2與Ubuntu 16.04以上(包含)的系統使用了新的Linux內核,在內存的估算上更準確, available這一列的具體含義能夠參見內核的這個commit.
Host.mem.free 剩餘內存量 bytes 計算方法:(total-used)
Host.mem.freeutilization 剩餘內存百分比 % 計算方法:(available/total*100%)
Host.mem.usedutilization 內存使用率 % 計算方法:(actualused/total*100%)

3、系統平均負載監控項

  • 可參考Linux top命令來理解各項指標含義。監控項數值越高表明系統越繁忙。
監控項名稱 監控項含義 單位
Host.load1 過去1分鐘的系統平均負載,Windows操做系統沒有此指標
Host.load5 過去5分鐘的系統平均負載,Windows操做系統沒有此指標
Host.load15 過去15分鐘的系統平均負載,Windows操做系統沒有此指標

4、磁盤相關監控項

  • 磁盤使用率與inode使用率可參考Linux df命令。
  • 磁盤讀寫指標可參考Linux iostat命令。
監控項名稱 監控項含義 單位
Host.diskusage.used 磁盤的已用存儲空間 bytes
Host.disk.utilization 磁盤使用率 %
Host.diskusage.free 磁盤的剩餘存儲空間 bytes
Host.diskussage.total 磁盤存儲總量 bytes
Host.disk.readbytes 磁盤每秒讀取的字節數 bytes/s
Host.disk.writebytes 磁盤每秒寫入的字節數 bytes/s
Host.disk.readiops 磁盤每秒的讀請求數量 次/秒
Host.disk.writeiops 磁盤每秒的寫請求數量 次/秒

5、文件系統監控項

監控項名稱 監控項含義 單位 說明
Host.fs.inode inode使用率,UNIX/Linux系統內部使用inode號碼來識別文件,磁盤還未存滿,但inode已經分配完時會出現沒法在磁盤新建文件的狀況。 % inode數量表明文件系統文件數量,大量小文件會致使inode使用率太高

6、網絡相關監控項

  • 如下爲網絡相關指標,可參考Linux iftop。TCP鏈接數的採集,可參考Linux ss命令。linux

  • TCP鏈接數會默認採集 TCP_TOTAL(總鏈接數)、ESTABLISHED(正常鏈接狀態),NON_ESTABLISHED(非鏈接的狀態鏈接數,ESTABLISHED之外的全部狀態),若是您須要獲取各個狀態鏈接數的數量,請按以下說明操做:ios

    • Linux

    將cloudmonitor/config/conf.properties配置文件的netstat.tcp.disable改成false來開啓採集。修改配置後請重啓Agent。git

監控項名稱 監控項含義 單位
Host.netin.rate 網卡每秒接收的比特數,即網卡的上行帶寬 bits/s
Host.netout.rate 網卡每秒發送的比特數,即網卡的下行帶寬 bits/s
Host.netin.packages 網卡每秒接收的數據包數 個/秒
Host.netout.packages 網卡每秒發送的數據包數 個/秒
Host.netin.errorpackage 設備驅動器檢測到的接收錯誤包的數量 個/秒
Host.netout.errorpackages 設備驅動器檢測到的發送錯誤包的數量 個/秒
Host.tcpconnection 各類狀態下的TCP鏈接數包括LISTEN、SYN_SENT、ESTABLISHED、SYN_RECV、FIN_WAIT一、CLOSE_WAIT、FIN_WAIT二、LAST_ACK、TIME_WAIT、CLOSING、CLOSED

7、進程相關監控項

  • 進程的CPU使用率、內存使用率可參考Linux top命令,CPU使用率爲多核使用狀況。
  • Host.process.openfile 可參考Linux lsof命令。
  • Host.process.number 可參考Linux ps aux |grep ‘關鍵字’ 命令
監控項名稱 監控項含義 單位
Host.process.cpu 某個進程消耗的CPU百分比 %
Host.process.memory 某個進程消耗的內存百分比 %
Host.process.openfile 當前進程打開文件數
Host.process.number 指定關鍵字的進程數
相關文章
相關標籤/搜索