主要監控4個指標:cpu mem io load average(負載)linux
1. cpuide
使用sar -u 或者 sar -u 5 5 命令查看CPU:(須要安裝yum install sysstat)ui
userspa
system3d
若是iowait持續的高,說明磁盤io存在瓶頸。解決方式:1.更換更好的磁盤 2.程序處理不當,需排查orm
2. load average(負載)
blog
使用top命令查看:隊列
一段時間內,cpu正在處理 + 等待cpu處理 的進程數之和進程
1分鐘、5分鐘、10分鐘 內存
通常關注5分鐘、10分鐘
理想的laod average < cpu個數 * 核數 * 0.7
cpu個數:grep 'physical id ' /proc/cpuinfo | sort -u
核數:grep 'core id ' /proc/cpuinfo | sort -u | wc -l
按住鍵盤上的數字1,能夠看到cpu0、cpu一、cpu2的資源佔用(0,1,2表示有3個cpu)
幾個cpu通常來講比較均衡,cpu0至關因而帶頭大哥,若是它佔的很高,這是個問題,須要解決
3. mem
使用 sar -r 或者 sar -r 5 5 命令查看內存
linux潛在規則:儘量的使用內存來提升io的效率
free
used
cache
buffer
總的物理內存=used+free
實際可用的物理內存=free+buffer+cache
實際使用的物理內存=used-buffer-cache
%memused:能夠直接看出用了多少,還剩多少
若是剩餘的內存很少,那麼須要加內存,或者程序問題(好比內存泄漏等)
4. io
使用 sar -d 或者 sar -d 5 5 命令查看io
avgqu-sz:io隊列的長度,隊列越長,io壓力越大
await: io操做的等待時間 ms -- 瞭解?
svctm: 被服務的時間 越接近await,等待的時間越少,io效果越好 -- 瞭解?
util: io繁忙程度 持續>80%, 須要排查是由於什麼繁忙