mpstat -P ALL 和 sar -P ALL
說明:sar -P ALL > aaa.txt 重定向輸出內容到文件 aaa.txthtml
常常用來監控linux的系統情況,好比cpu、內存的使用,程序員基本都知道這個命令,但比較奇怪的是能用好它的人卻不多,例如top監控視圖中內存數值的含義就有很多的曲解。
本文經過一個運行中的WEB服務器的top監控截圖,講述top視圖中的各類數據的含義,還包括視圖中各進程(任務)的字段的排序。java
第一行:
10:08:45 — 當前系統時間
10 days, 3:05 — 系統已經運行了10天3小時5分鐘(在這期間沒有重啓過)
1 users — 當前有1個用戶登陸系統
load average: 0.00, 0.00, 0.00 — load average後面的三個數分別是1分鐘、5分鐘、15分鐘的負載狀況。
load average數據是每隔5秒鐘檢查一次活躍的進程數,而後按特定算法計算出的數值。若是這個數除以邏輯CPU的數量,結果高於5的時候就代表系統在超負荷運轉了。
第二行:
Tasks — 任務(進程),系統如今共有135個進程,其中處於運行中的有1個,134個在休眠(sleep),stoped狀態的有0個,zombie狀態(殭屍)的有0個。
第三行:cpu狀態
0.3% us — 用戶空間佔用CPU的百分比。
0.0% sy — 內核空間佔用CPU的百分比。
0.0% ni — 改變過優先級的進程佔用CPU的百分比
99.7% id — 空閒CPU百分比
0.0% wa — IO等待佔用CPU的百分比
0.0% hi — 硬中斷(Hardware IRQ)佔用CPU的百分比
0.0% si — 軟中斷(Software Interrupts)佔用CPU的百分比
在這裏CPU的使用比率和windows概念不一樣,若是你不理解用戶空間和內核空間,須要充充電了。
第四行:內存狀態
3808060k total — 物理內存總量(4GB)
3660048k used — 使用中的內存總量(3.6GB)
148012k free — 空閒內存總量(148M)
359760k buffers — 緩存的內存量 (359M)
第五行:swap交換分區
4184924k total — 交換區總量(4G)
0k used — 使用的交換區總量(0M)
4184924k free — 空閒交換區總量(4G)
2483956k cached — 緩衝的交換區總量(2483M)linux
第四行中使用中的內存總量(used)指的是如今系統內核控制的內存數,空閒內存總量(free)是內核還未歸入其管控範圍的數量。歸入內核管理的內存不見得都在使用中,還包括過去使用過的如今能夠被重複利用的內存,內核並不把這些可被從新使用的內存交還到free中去,所以在linux上free內存會愈來愈少,但不用爲此擔憂。ios
若是出於習慣去計算可用內存數,這裏有個近似的計算公式:第四行的free + 第四行的buffers + 第五行的cached,按這個公式此臺服務器的可用內存:148M+259M+2483M = 2990M。程序員
對於內存監控,在top裏咱們要時刻監控第五行swap交換分區的used,若是這個數值在不斷的變化,說明內核在不斷進行內存和swap的數據交換,這是真正的內存不夠用了。web
第六行是空行算法
第七行如下:各進程(任務)的狀態監控
PID — 進程id
USER — 進程全部者
PR — 進程優先級
NI — nice值。負值表示高優先級,正值表示低優先級
VIRT — 進程使用的虛擬內存總量,單位kb。VIRT=SWAP+RES
RES — 進程使用的、未被換出的物理內存大小,單位kb。RES=CODE+DATA
SHR — 共享內存大小,單位kb
S — 進程狀態。D=不可中斷的睡眠狀態 R=運行 S=睡眠 T=跟蹤/中止 Z=殭屍進程
%CPU — 上次更新到如今的CPU時間佔用百分比
%MEM — 進程使用的物理內存百分比
TIME+ — 進程使用的CPU時間總計,單位1/100秒
COMMAND — 進程名稱(命令名/命令行)windows
在top基本視圖中,按鍵盤數字「1」,可監控每一個邏輯CPU的情況:緩存
觀察上圖,服務器有4個邏輯CPU,其實是1個物理CPU。服務器
若是不按1,則在top視圖裏面顯示的是全部cpu的平均值。
默認進入top時,各進程是按照CPU的佔用量來排序的,在【top視圖 01】中進程ID爲14210的java進程排在第一(cpu佔用100%),進程ID爲14183的java進程排在第二(cpu佔用12%)。可經過鍵盤指令來改變排序字段,好比想監控哪一個進程佔用MEM最多,我通常的使用方法以下:
1. 敲擊鍵盤「b」(打開/關閉加亮效果),top的視圖變化以下:
咱們發現進程id爲12363的「top」進程被加亮了,top進程就是視圖第二行顯示的惟一的運行態(runing)的那個進程,能夠經過敲擊「y」鍵關閉或打開運行態進程的加亮效果。
2. 敲擊鍵盤「x」(打開/關閉排序列的加亮效果),top的視圖變化以下:
能夠看到,top默認的排序列是「%CPU」。
3. 經過」shift + >」或」shift + <」能夠向右或左改變排序列,下圖是按一次」shift + >」的效果圖:
視圖如今已經按照%MEM來排序了。
1. 敲擊「f」鍵,top進入另外一個視圖,在這裏能夠編排基本視圖中的顯示字段:
這裏列出了全部可在top基本視圖中顯示的進程字段,有」*」而且標註爲大寫字母的字段是可顯示的,沒有」*」而且是小寫字母的字段是不顯示的。若是要在基本視圖中顯示「CODE」和「DATA」兩個字段,能夠經過敲擊「r」和「s」鍵:
2. 「回車」返回基本視圖,能夠看到多了「CODE」和「DATA」兩個字段:
top命令是Linux上進行系統監控的首選命令,但有時候卻達不到咱們的要求,好比當前這臺服務器,top監控有很大的侷限性。這臺服務器運行着websphere集羣,有兩個節點服務,就是【top視圖 01】中的老大、老二兩個java進程,top命令的監控最小單位是進程,因此看不到我關心的java線程數和客戶鏈接數,而這兩個指標是java的web服務很是重要的指標,一般我用ps和netstate兩個命令來補充top的不足。
監控java線程數:
ps -eLf | grep java | wc -l
監控網絡客戶鏈接數:
netstat -n | grep tcp | grep 偵聽端口 | wc -l
上面兩個命令,可改動grep的參數,來達到更細緻的監控要求。
在Linux系統「一切都是文件」的思想貫徹指導下,全部進程的運行狀態均可以用文件來獲取。系統根目錄/proc中,每個數字子目錄的名字都是運行中的進程的PID,進入任一個進程目錄,可經過其中文件或目錄來觀察進程的各項運行指標,例如task目錄就是用來描述進程中線程的,所以也能夠經過下面的方法獲取某進程中運行中的線程數量(PID指的是進程ID):
ls /proc/PID/task | wc -l
在linux中還有一個命令pmap,來輸出進程內存的情況,能夠用來分析線程堆棧:
pmap PID
你們都熟悉Linux下能夠經過top命令來查看全部進程的內存,CPU等信息。除此以外,還有其餘一些命令,能夠獲得更詳細的信息,例如進程相關
cat /proc/your_PID/status
經過top或ps -ef | grep '進程名' 獲得進程的PID。該命令能夠提供進程狀態、文件句柄數、內存使用狀況等信息。
內存相關
vmstat -s -S M
該能夠查看包含內存每一個項目的報告,經過-S M或-S k能夠指定查看的單位,默認爲kb。結合watch命令就能夠看到動態變化的報告了。
也可用 cat /proc/meminfo
要看cpu的配置信息可用
cat /proc/cpuinfo
它能顯示諸如CPU核心數,時鐘頻率、CPU型號等信息。
要查看cpu波動狀況的,尤爲是多核機器上,可以使用
mpstat -P ALL 10
該命令可間隔10秒鐘採樣一次CPU的使用狀況,每一個核的狀況都會顯示出來,例如,每一個核的idle狀況等。
只需查看均值的,可用
iostat -c
IO相關
iostat -P ALL
該命令可查看全部設備使用率、讀寫字節數等信息。
另外,htop ,有時間能夠用一下。
# 總核數 = 物理CPU個數 X 每顆物理CPU的核數
# 總邏輯CPU數 = 物理CPU個數 X 每顆物理CPU的核數 X 超線程數
# 查看物理CPU個數
cat /proc/cpuinfo| grep "physical id"| sort| uniq| wc -l
# 查看每一個物理CPU中core的個數(即核數)
cat /proc/cpuinfo| grep "cpu cores"| uniq
# 查看邏輯CPU的個數
cat /proc/cpuinfo| grep "processor"| wc -l
查看CPU信息(型號)cat /proc/cpuinfo | grep name | cut -f2 -d: | uniq -c