首先介紹top中一些字段的含義:html
VIRT:virtual memory usage 虛擬內存
一、進程「須要的」虛擬內存大小,包括進程使用的庫、代碼、數據等
二、假如進程申請100m的內存,但實際只使用了10m,那麼它會增加100m,而不是實際的使用量java
RES:resident memory usage 常駐內存
一、進程當前使用的內存大小,但不包括swap out
二、包含其餘進程的共享
三、若是申請100m的內存,實際使用10m,它只增加10m,與VIRT相反
四、關於庫佔用內存的狀況,它只統計加載的庫文件所佔內存大小linux
SHR:shared memory 共享內存
一、除了自身進程的共享內存,也包括其餘進程的共享內存
二、雖然進程只使用了幾個共享庫的函數,但它包含了整個共享庫的大小
三、計算某個進程所佔的物理內存大小公式:RES – SHR
四、swap out後,它將會降下來程序員
DATA
一、數據佔用的內存。若是top沒有顯示,按f鍵能夠顯示出來。
二、真正的該程序要求的數據空間,是真正在運行中要使用的。web
top 運行中能夠經過 top 的內部命令對進程的顯示方式進行控制。內部命令以下:
s – 改變畫面更新頻率
l – 關閉或開啓第一部分第一行 top 信息的表示
t – 關閉或開啓第一部分第二行 Tasks 和第三行 Cpus 信息的表示
m – 關閉或開啓第一部分第四行 Mem 和 第五行 Swap 信息的表示
N – 以 PID 的大小的順序排列表示進程列表
P – 以 CPU 佔用率大小的順序排列進程列表
M – 之內存佔用率大小的順序排列進程列表
h – 顯示幫助
n – 設置在進程列表所顯示進程的數量
q – 退出 top
s – 改變畫面更新週期算法
序號 列名 含義
a PID 進程id
b PPID 父進程id
c RUSER Real user name
d UID 進程全部者的用戶id
e USER 進程全部者的用戶名
f GROUP 進程全部者的組名
g TTY 啓動進程的終端名。不是從終端啓動的進程則顯示爲 ?
h PR 優先級
i NI nice值。負值表示高優先級,正值表示低優先級
j P 最後使用的CPU,僅在多CPU環境下有意義
k %CPU 上次更新到如今的CPU時間佔用百分比
l TIME 進程使用的CPU時間總計,單位秒
m TIME+ 進程使用的CPU時間總計,單位1/100秒
n %MEM 進程使用的物理內存百分比
o VIRT 進程使用的虛擬內存總量,單位kb。VIRT=SWAP+RES
p SWAP 進程使用的虛擬內存中,被換出的大小,單位kb。
q RES 進程使用的、未被換出的物理內存大小,單位kb。RES=CODE+DATA
r CODE 可執行代碼佔用的物理內存大小,單位kb
s DATA 可執行代碼之外的部分(數據段+棧)佔用的物理內存大小,單位kb
t SHR 共享內存大小,單位kb
u nFLT 頁面錯誤次數
v nDRT 最後一次寫入到如今,被修改過的頁面數。
w S 進程狀態。(D=不可中斷的睡眠狀態,R=運行,S=睡眠,T=跟蹤/中止,Z=殭屍進程)
x COMMAND 命令名/命令行
y WCHAN 若該進程在睡眠,則顯示睡眠中的系統函數名
z Flags 任務標誌,參考 sched.hwindows
默認狀況下僅顯示比較重要的 PID、USER、PR、NI、VIRT、RES、SHR、S、%CPU、%MEM、TIME+、COMMAND 列。能夠經過下面的快捷鍵來更改顯示內容。緩存
經過 f 鍵能夠選擇顯示的內容。按 f 鍵以後會顯示列的列表,按 a-z 便可顯示或隱藏對應的列,最後按回車鍵肯定。
按 o 鍵能夠改變列的顯示順序。按小寫的 a-z 能夠將相應的列向右移動,而大寫的 A-Z 能夠將相應的列向左移動。最後按回車鍵肯定。
按大寫的 F 或 O 鍵,而後按 a-z 能夠將進程按照相應的列進行排序。而大寫的 R 鍵能夠將當前的排序倒轉。安全
top使用方法:服務器
使用格式:
top [-] [d] [p] [q] [c] [C] [S] [s] [n]
參數說明:
d:指定每兩次屏幕信息刷新之間的時間間隔。固然用戶可使用s交互命令來改變之。
p:經過指定監控進程ID來僅僅監控某個進程的狀態。
q:該選項將使top沒有任何延遲的進行刷新。若是調用程序有超級用戶權限,那麼top將以儘量高的優先級運行。
S:指定累計模式。
s:使top命令在安全模式中運行。這將去除交互命令所帶來的潛在危險。
i:使top不顯示任何閒置或者僵死進程。
c:顯示整個命令行而不僅是顯示命令名。
經常使用命令說明:
Ctrl+L:擦除而且重寫屏幕
K:終止一個進程。系統將提示用戶輸入須要終止的進程PID,以及須要發送給該進程什麼樣的信號。通常的終止進程可使用15信號;若是不能正常結束那就使用信號9強制結束該進程。默認值是信號15。在安全模式中此命令被屏蔽。
i:忽略閒置和僵死進程。這是一個開關式命令。
q:退出程序
r:從新安排一個進程的優先級別。系統提示用戶輸入須要改變的進程PID以及須要設置的進程優先級值。輸入一個正值將使優先級下降,反之則可使該進程擁有更高的優先權。默認值是10。
S:切換到累計模式。
s:改變兩次刷新之間的延遲時間。系統將提示用戶輸入新的時間,單位爲s。若是有小數,就換算成m s。輸入0值則系統將不斷刷新,默認值是5 s。須要注意的是若是設置過小的時間,極可能會引發不斷刷新,從而根原本不及看清顯示的狀況,並且系統負載也會大大增長。
f或者F:從當前顯示中添加或者刪除項目。
o或者O:改變顯示項目的順序
l:切換顯示平均負載和啓動時間信息。
m:切換顯示內存信息。
t:切換顯示進程和CPU狀態信息。
c:切換顯示命令名稱和完整命令行。
M:根據駐留內存大小進行排序。
P:根據CPU使用百分比大小進行排序。
T:根據時間/累計時間進行排序。
W:將當前設置寫入~/.toprc文件中。
查看多核CPU命令
mpstat -P ALL 和 sar -P ALL
說明:sar -P ALL > aaa.txt 重定向輸出內容到文件 aaa.txt
top命令常常用來監控Linux的系統情況,好比cpu、內存的使用,程序員基本都知道這個命令,但比較奇怪的是能用好它的人卻不多,例如top監控視圖中內存數值的含義就有很多的曲解。
本文經過一個運行中的WEB服務器的top監控截圖,講述top視圖中的各類數據的含義,還包括視圖中各進程(任務)的字段的排序。
輸入top命令
1.1 系統運行時間和平均負載:
- 當前時間
- 系統已運行的時間
- 當前登陸用戶的數量
- 相應最近五、10和15分鐘內的平均負載。
可使用'l'命令切換uptime的顯示。
21:45:11 — 當前系統時間
0 days, 4:54 — 系統已經運行了4小時54分鐘(在這期間沒有重啓過)
2 users — 當前有2個用戶登陸系統
load average:0.24, 0.15, 0.19 — load average後面的三個數分別是5分鐘、10分鐘、15分鐘的負載狀況。
load average數據是每隔5秒鐘檢查一次活躍的進程數,而後按特定算法計算出的數值。若是這個數除以邏輯CPU的數量,結果高於5的時候就代表系統在超負荷運轉了。
- us, user: 運行(未調整優先級的) 用戶進程的CPU時間
- sy,system: 運行內核進程的CPU時間
- ni,niced:運行已調整優先級的用戶進程的CPU時間
- wa,IO wait: 用於等待IO完成的CPU時間
- hi:處理硬件中斷的CPU時間
- si: 處理軟件中斷的CPU時間
- st:這個虛擬機被hypervisor偷去的CPU時間(譯註:若是當前處於一個hypervisor下的vm,實際上hypervisor也是要消耗一部分CPU處理時間的)。
可使用't'命令切換顯示。
1.3% us — 用戶空間佔用CPU的百分比。1.0% sy — 內核空間佔用CPU的百分比。
0.0% ni — 改變過優先級的進程佔用CPU的百分比
97.3% id — 空閒CPU百分比
0.0% wa — IO等待佔用CPU的百分比
0.3% hi — 硬中斷(Hardware IRQ)佔用CPU的百分比
0.0% si — 軟中斷(Software Interrupts)佔用CPU的百分比
在這裏CPU的使用比率和windows概念不一樣,若是你不理解用戶空間和內核空間,須要充充電了。
接下來兩行顯示內存使用率,有點像'free'命令。第一行是物理內存使用,第二行是虛擬內存使用(交換空間)。
物理內存顯示以下:所有可用內存、已使用內存、空閒內存、緩衝內存。類似地:交換部分顯示的是:所有、已使用、空閒和緩衝交換空間。
內存顯示能夠用'm'命令切換。
509248k total — 物理內存總量(509M)495964k used — 使用中的內存總量(495M)
13284k free — 空閒內存總量(13M)
25364k buffers — 緩存的內存量 (25M)
swap交換分區
492536k total — 交換區總量(492M)
11856k used — 使用的交換區總量(11M)
480680k free — 空閒交換區總量(480M)
202224k cached — 緩衝的交換區總量(202M)
這裏要說明的是不能用windows的內存概念理解這些數據,若是按windows的方式此臺服務器「危矣」:8G的內存總量只剩下530M的可用內存。Linux的內存管理有其特殊性,複雜點須要一本書來講明,這裏只是簡單說點和咱們傳統概念(windows)的不一樣。
第四行中使用中的內存總量(used)指的是如今系統內核控制的內存數,空閒內存總量(free)是內核還未歸入其管控範圍的數量。歸入內核管理的內存不見得都在使用中,還包括過去使用過的如今能夠被重複利用的內存,內核並不把這些可被從新使用的內存交還到free中去,所以在linux上free內存會愈來愈少,但不用爲此擔憂。
若是出於習慣去計算可用內存數,這裏有個近似的計算公式:第四行的free + 第四行的buffers + 第五行的cached,按這個公式此臺服務器的可用內存:
13284+25364+202224 = 240M。
對於內存監控,在top裏咱們要時刻監控第五行swap交換分區的used,若是這個數值在不斷的變化,說明內核在不斷進行內存和swap的數據交換,這是真正的內存不夠用了。
PID:進程ID,進程的惟一標識符
USER:進程全部者的實際用戶名。
PR:進程的調度優先級。這個字段的一些值是'rt'。這意味這這些進程運行在實時態。
NI:進程的nice值(優先級)。越小的值意味着越高的優先級。負值表示高優先級,正值表示低優先級
VIRT:進程使用的虛擬內存。進程使用的虛擬內存總量,單位kb。VIRT=SWAP+RES
RES:駐留內存大小。駐留內存是任務使用的非交換物理內存大小。進程使用的、未被換出的物理內存大小,單位kb。RES=CODE+DATA
SHR:SHR是進程使用的共享內存。共享內存大小,單位kb
S:這個是進程的狀態。它有如下不一樣的值:
- D - 不可中斷的睡眠態。
- R – 運行態
- S – 睡眠態
- T – 被跟蹤或已中止
- Z – 殭屍態
%CPU:自從上一次更新時到如今任務所使用的CPU時間百分比。
%MEM:進程使用的可用物理內存百分比。
TIME+:任務啓動後到如今所使用的所有CPU時間,精確到百分之一秒。
COMMAND:運行進程所使用的命令。進程名稱(命令名/命令行)
還有許多在默認狀況下不會顯示的輸出,它們能夠顯示進程的頁錯誤、有效組和組ID和其餘更多的信息。
交互命令
2.1 ‘h’: 幫助
能夠用h或?顯示交互命令的幫助菜單。
2.2 ‘<ENTER>’ 或者 ‘<SPACE>’: 刷新顯示
top命令默認在一個特定間隔(3秒)後刷新顯示。要手動刷新,用戶能夠輸入回車或者空格。
多U多核CPU監控
在top基本視圖中,按鍵盤數字「1」,可監控每一個邏輯CPU的情況:
top視圖 02
觀察上圖,服務器有16個邏輯CPU,其實是4個物理CPU。
進程字段排序
默認進入top時,各進程是按照CPU的佔用量來排序的,在【top視圖 01】中進程ID爲14210的Java進程排在第一(cpu佔用100%),進程ID爲14183的java進程排在第二(cpu佔用12%)。可經過鍵盤指令來改變排序字段,好比想監控哪一個進程佔用MEM最多,我通常的使用方法以下:
1. 敲擊鍵盤「b」(打開/關閉加亮效果),top的視圖變化以下:
top視圖 03
咱們發現進程id爲10704的「top」進程被加亮了,top進程就是視圖第二行顯示的惟一的運行態(runing)的那個進程,能夠經過敲擊「y」鍵關閉或打開運行態進程的加亮效果。
2. 敲擊鍵盤「x」(打開/關閉排序列的加亮效果),top的視圖變化以下:
top視圖 04
能夠看到,top默認的排序列是「%CPU」。
3. 經過」shift + >」或」shift + <」能夠向右或左改變排序列,下圖是按一次」shift + >」的效果圖:
top視圖 05
視圖如今已經按照%MEM來排序了。
改變進程顯示字段
1. 敲擊「f」鍵,top進入另外一個視圖,在這裏能夠編排基本視圖中的顯示字段:
top視圖 06
這裏列出了全部可在top基本視圖中顯示的進程字段,有」*」而且標註爲大寫字母的字段是可顯示的,沒有」*」而且是小寫字母的字段是不顯示的。若是要在基本視圖中顯示「CODE」和「DATA」兩個字段,能夠經過敲擊「r」和「s」鍵:
top視圖 07
2. 「回車」返回基本視圖,能夠看到多了「CODE」和「DATA」兩個字段:
top視圖 08
top命令的補充
top命令是Linux上進行系統監控的首選命令,但有時候卻達不到咱們的要求,好比當前這臺服務器,top監控有很大的侷限性。這臺服務器運行着websphere集羣,有兩個節點服務,就是【top視圖 01】中的老大、老二兩個java進程,top命令的監控最小單位是進程,因此看不到我關心的java線程數和客戶鏈接數,而這兩個指標是java的web服務很是重要的指標,一般我用ps和netstate兩個命令來補充top的不足。
監控java線程數:
ps -eLf | grep java | wc -l
監控網絡客戶鏈接數:
netstat -n | grep tcp | grep 偵聽端口 | wc -l
上面兩個命令,可改動grep的參數,來達到更細緻的監控要求。
在Linux系統「一切都是文件」的思想貫徹指導下,全部進程的運行狀態均可以用文件來獲取。系統根目錄/proc中,每個數字子目錄的名字都是運行中的進程的PID,進入任一個進程目錄,可經過其中文件或目錄來觀察進程的各項運行指標,例如task目錄就是用來描述進程中線程的,所以也能夠經過下面的方法獲取某進程中運行中的線程數量(PID指的是進程ID):
ls /proc/PID/task | wc -l
在linux中還有一個命令pmap,來輸出進程內存的情況,能夠用來分析線程堆棧:
pmap PID