Linux top和負載的說明

轉自:http://bbs.linuxtone.org/thread-1684-1-1.htmlhtml

top命令是Linux下經常使用的性能分析工具,可以實時顯示系統中各個進程的資源佔用情況,相似於Windows的任務管理器。下面詳細介紹它的使用方法。linux

top - 01:06:48 up  1:22,  1 user,  load average: 0.06, 0.60,  0.48
            Tasks:  29 total,   1 running,  28 sleeping,   0 stopped,   0  zombie
            Cpu(s):  0.3% us,  1.0% sy,  0.0% ni, 98.7% id,  0.0% wa,  0.0%  hi,  0.0% si
            Mem:    191272k total,   173656k used,    17616k free,    22052k  buffers
            Swap:   192772k total,        0k used,   192772k free,   123988k  cached
            
            PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM     TIME+  COMMAND
            1379 root      16   0  7976 2456 1980 S  0.7  1.3   0:11.03  sshd
            14704 root      16   0  2128  980  796 R  0.7  0.5   0:02.72 top
            1 root      16   0  1992  632  544 S  0.0  0.3   0:00.90 init
            2 root       34  19     0    0    0 S  0.0  0.0   0:00.00 ksoftirqd/0
            3 root       RT   0     0    0    0 S  0.0  0.0   0:00.00  watchdog/0

統計信息區前五行是系統總體的統計信息。第一行是任務隊列信息,同 uptime  命令的執行結果。其內容以下:windows

01:06:48 當前時間
up 1:22 系統運行時間,格式爲時:分
1 user 當前登陸用戶數
load average: 0.06, 0.60, 0.48 系統負載,即任務隊列的平均長度。             三個數值分別爲  1分鐘、5分鐘、15分鐘前到如今的平均值。

第2、三行爲進程和CPU的信息。當有多個CPU時,這些內容可能會超過兩行。內容以下:緩存

Tasks: 29 total 進程總數
1 running 正在運行的進程數
28 sleeping 睡眠的進程數
0 stopped 中止的進程數
0 zombie 殭屍進程數
Cpu(s): 0.3% us 用戶空間佔用CPU百分比
1.0% sy 內核空間佔用CPU百分比
0.0% ni 用戶進程空間內改變過優先級的進程佔用CPU百分比
98.7% id 空閒CPU百分比
0.0% wa 等待輸入輸出的CPU時間百分比
0.0% hi  
0.0% si  

最後兩行爲內存信息。內容以下:安全

Mem: 191272k total 物理內存總量
173656k used 使用的物理內存總量
17616k free 空閒內存總量
22052k buffers 用做內核緩存的內存量
Swap: 192772k total 交換區總量
0k used 使用的交換區總量
192772k free 空閒交換區總量
123988k cached 緩衝的交換區總量。             內存中的內容被換出到交換區,然後又被換入到內存,但使用過的交換區還沒有被覆蓋,             該數值即爲這些內容已存在於內存中的交換區的大小。             相應的內存再次被換出時可沒必要再對交換區寫入。

進程信息區統計信息區域的下方顯示了各個進程的詳細信息。首先來認識一下各列的含義。服務器

序號 列名 含義
a PID 進程id
b PPID 父進程id
c RUSER Real user name
d UID 進程全部者的用戶id
e USER 進程全部者的用戶名
f GROUP 進程全部者的組名
g TTY 啓動進程的終端名。不是從終端啓動的進程則顯示爲 ?
h PR 優先級
i NI nice值。負值表示高優先級,正值表示低優先級
j P 最後使用的CPU,僅在多CPU環境下有意義
k %CPU 上次更新到如今的CPU時間佔用百分比
l TIME 進程使用的CPU時間總計,單位秒
m TIME+ 進程使用的CPU時間總計,單位1/100秒
n %MEM 進程使用的物理內存百分比
o VIRT 進程使用的虛擬內存總量,單位kb。VIRT=SWAP+RES
p SWAP 進程使用的虛擬內存中,被換出的大小,單位kb。
q RES 進程使用的、未被換出的物理內存大小,單位kb。RES=CODE+DATA
r CODE 可執行代碼佔用的物理內存大小,單位kb
s DATA 可執行代碼之外的部分(數據段+棧)佔用的物理內存大小,單位kb
t SHR 共享內存大小,單位kb
u nFLT 頁面錯誤次數
v nDRT 最後一次寫入到如今,被修改過的頁面數。
w S 進程狀態。             D=不可中斷的睡眠狀態             R=運行             S=睡眠             T=跟蹤/中止             Z=殭屍進程
x COMMAND 命令名/命令行
y WCHAN 若該進程在睡眠,則顯示睡眠中的系統函數名
z Flags 任務標誌,參考 sched.h

默認狀況下僅顯示比較重要的  PID、USER、PR、NI、VIRT、RES、SHR、S、%CPU、%MEM、TIME+、COMMAND  列。能夠經過下面的快捷鍵來更改顯示內容。 更改顯示內容經過 f 鍵能夠選擇顯示的內容。按 f 鍵以後會顯示列的列表,按 a-z  便可顯示或隱藏對應的列,最後按回車鍵肯定。 按 o 鍵能夠改變列的顯示順序。按小寫的 a-z 能夠將相應的列向右移動,而大寫的 A-Z  能夠將相應的列向左移動。最後按回車鍵肯定。 按大寫的 FO 鍵,而後按 a-z 能夠將進程按照相應的列進行排序。而大寫的  R 鍵能夠將當前的排序倒轉。 命令使用 1.  工具(命令)名稱 top 2.工具(命令)做用 顯示系統當前的進程和其餘情況;top是一個動態顯示過程,便可以經過用戶按鍵來不斷刷新當前狀態.若是在前臺執行該命令,它將獨佔前臺,直到用戶終止該程序爲止.比較準確的說,top命令提供了實時的對系統處理器的狀態監視.它將顯示系統中CPU最「敏感」的任務列表.該命令能夠按CPU使用.內存使用和執行時間對任務進行排序;並且該命令的不少特性均可以經過交互式命令或者在我的定製文件中進行設定. 3.環境設置 在Linux下使用。 4.使用方法 4.1使用格式 top [-] [d] [p] [q] [c] [C] [S]    [n] 4.2參數說明 d  指定每兩次屏幕信息刷新之間的時間間隔。固然用戶可使用s交互命令來改變之。 p  經過指定監控進程ID來僅僅監控某個進程的狀態。 q該選項將使top沒有任何延遲的進行刷新。若是調用程序有超級用戶權限,那麼top將以儘量高的優先級運行。 S 指定累計模式 s  使top命令在安全模式中運行。這將去除交互命令所帶來的潛在危險。 i  使top不顯示任何閒置或者僵死進程。 c  顯示整個命令行而不僅是顯示命令名 4.3其餘 下面介紹在top命令執行過程當中可使用的一些交互命令。從使用角度來看,熟練的掌握這些命令比掌握選項還重要一些。這些命令都是單字母的,若是在命令行選項中使用了s選項,則可能其中一些命令會被屏蔽掉。 Ctrl+L 擦除而且重寫屏幕。 h或者?  顯示幫助畫面,給出一些簡短的命令總結說明。 k  終止一個進程。系統將提示用戶輸入須要終止的進程PID,以及須要發送給該進程什麼樣的信號。通常的終止進程可使用15信號;若是不能正常結束那就使用信號9強制結束該進程。默認值是信號15。在安全模式中此命令被屏蔽。 i 忽略閒置和僵死進程。這是一個開關式命令。 q  退出程序。 r  從新安排一個進程的優先級別。系統提示用戶輸入須要改變的進程PID以及須要設置的進程優先級值。輸入一個正值將使優先級下降,反之則可使該進程擁有更高的優先權。默認值是10。 S 切換到累計模式。 s  改變兩次刷新之間的延遲時間。系統將提示用戶輸入新的時間,單位爲s。若是有小數,就換算成m s。輸入0值則系統將不斷刷新,默認值是5  s。須要注意的是若是設置過小的時間,極可能會引發不斷刷新,從而根原本不及看清顯示的狀況,並且系統負載也會大大增長。 f或者F 從當前顯示中添加或者刪除項目。 o或者O  改變顯示項目的順序。 l 切換顯示平均負載和啓動時間信息。 m 切換顯示內存信息。 t  切換顯示進程和CPU狀態信息。 c  切換顯示命令名稱和完整命令行。 M  根據駐留內存大小進行排序。 P 根據CPU使用百分比大小進行排序。 T 根據時間/累計時間進行排序。 W  將當前設置寫入~/.toprc文件中。這是寫top配置文件的推薦方法。 ----- 一、獲取cpu佔用狀況
[root@localhost utx86]# top -n 1 |grep Cpu Cpu(s):  1.9%us,  1.3%sy,  0.0%ni, 95.9%id,  0.6%wa,  0.1%hi,  0.2%si,  0.0%st
解釋:1.9%us是用戶佔用cpu狀況
1.3%sy,是系統佔用cpu狀況
二、得到內存佔用狀況
[root@localhost utx86]# top -n 1 |grep Mem Mem:   2066240k total,  1515784k used,   550456k free,   195336k buffersssh

也許你在學習Linux操做系統,會遇到不少問題,這裏爲你講解Linux系統Load average負載的知識,你可能對於 Linux 的負載均值(load averages)已有了充分的瞭解。負載均值在 uptime 或者 top 命令中能夠看到,它們可能會顯示成這個樣子:函數

  load average: 0.09, 0.05, 0.01工具

  不少人會這樣理解負載均值:三個數分別表明不一樣時間段的系統平均負載(一分鐘、五 分鐘、以及十五分鐘),它們的數字固然是越小越好。數字越高,說明服務器的負載越 大,這也多是服務器出現某種問題的信號。性能

  而事實不徹底如此,是什麼因素構成了負載均值的大小,以及如何區分它們目前的情況是 「好」仍是「糟糕」?何時應該注意哪些不正常的數值?

  回答這些問題以前,首先須要瞭解下這些數值背後的些知識。咱們先用最簡單的例子說明, 一臺只配備一塊單核處理器的服務器。

  行車過橋

  一隻單核的處理器能夠形象得比喻成一條單車道。設想下,你如今須要收取這條道路的過橋 費 - 忙於處理那些將要過橋的車輛。你首先固然須要瞭解些信息,例如車輛的載重、以及還有多少車輛正在等待過橋。若是前面沒有車輛在等待,那麼你能夠告訴後面的司機經過。 若是車輛衆多,那麼須要告知他們可能須要稍等一會。

  所以,須要些特定的代號表示目前的車流狀況,例如:

  0.00 表示目前橋面上沒有任何的車流。 實際上這種狀況與 0.00 和 1.00 之間是相同的,總而言之很通暢,過往的車輛能夠絲絕不用等待的經過。

  1.00 表示恰好是在這座橋的承受範圍內。 這種狀況不算糟糕,只是車流會有些堵,不過這種狀況可能會形成交通愈來愈慢。

  超過 1.00,那麼說明這座橋已經超出負荷,交通嚴重的擁堵。 那麼狀況有多糟糕? 例如 2.00 的狀況說明車流已經超出了橋所能承受的一倍,那麼將有多餘過橋一倍的車輛正在焦急的等待。3.00 的話狀況就更不妙了,說明這座橋基本上已經快承受不了,還有超出橋負載兩倍多的車輛正在等待。

  上面的狀況和處理器的負載狀況很是類似。一輛汽車的過橋時間就比如是處理器處理某線程 的實際時間。Unix 系統定義的進程運行時長爲全部處理器內核的處理時間加上線程 在隊列中等待的時間。

  和收過橋費的管理員同樣,你固然但願你的汽車(操做)不會被焦急的等待。因此,理想狀態 下,都但願負載平均值小於 1.00 。固然不排除部分峯值會超過 1.00,但久而久之保持這 個狀態,就說明會有問題,這時候你應該會很焦急。

  「因此你說的理想負荷爲 1.00 ?」

  嗯,這種狀況其實並不徹底正確。負荷 1.00 說明系統已經沒有剩餘的資源了。在實際狀況中 ,有經驗的系統管理員都會將這條線劃在 0.70:

  「須要進行調查法則」: 若是長期你的系統負載在 0.70 上下,那麼你須要在事情變得更糟糕以前,花些時間瞭解其緣由。

  「如今就要修復法則」:1.00 。 若是你的服務器系統負載長期徘徊於 1.00,那麼就應該立刻解決這個問題。不然,你將半夜接到你上司的電話,這可不是件使人愉快的事情。

  「凌晨三點半鍛鍊身體法則」:5.00。 若是你的服務器負載超過了 5.00 這個數字,那麼你將失去你的睡眠,還得在會議中說明這狀況發生的緣由,總之千萬不要讓它發生。

  那麼多個處理器呢?個人均值是 3.00,可是系統運行正常!

  哇喔,你有四個處理器的主機?那麼它的負載均值在 3.00 是很正常的。

  在多處理器系統中,負載均值是基於內核的數量決定的。以 100% 負載計算,1.00 表示單個處理器,而 2.00 則說明有兩個雙處理器,那麼 4.00 就說明主機具備四個處理器。

  回到咱們上面有關車輛過橋的比喻。1.00 我說過是「一條單車道的道路」。那麼在單車道 1.00 狀況中,說明這橋樑已經被車塞滿了。而在雙處理器系統中,這意味着多出了一倍的 負載,也就是說還有 50% 的剩餘系統資源 - 由於還有另外條車道能夠通行。

  因此,單處理器已經在負載的狀況下,雙處理器的負載滿額的狀況是 2.00,它還有一倍的資源能夠利用。

  多核與多處理器

  先脫離下主題,咱們來討論下多核心處理器與多處理器的區別。從性能的角度上理解,一臺主 機擁有多核心的處理器與另臺擁有一樣數目的處理性能基本上能夠認爲是相差無幾。固然實際 狀況會複雜得多,不一樣數量的緩存、處理器的頻率等因素均可能形成性能的差別。

  但即使這些因素形成的實際性能稍有不一樣,其實系統仍是以處理器的核心數量計算負載均值 。這使咱們有了兩個新的法則:

  「有多少核心即爲有多少負荷」法則: 在多核處理中,你的系統均值不該該高於處理器核心的總數量。

  「核心的核心」法則: 核心分佈在分別幾個單個物理處理中並不重要,其實兩顆四核的處理器 等於 四個雙核處理器 等於 八個單處理器。因此,它應該有八個處理器內核。

  審視咱們本身

  讓咱們再來看看 uptime 的輸出

  ~ $ uptime

  23:05 up 14 days, 6:08, 7 users, load averages: 0.65 0.42 0.36

  這是個雙核處理器,從結果也說明有不少的空閒資源。實際狀況是即使它的峯值會到 1.7,我也歷來沒有考慮過它的負載問題。

  那麼,怎麼會有三個數字的確讓人困擾。咱們知道,0.6五、0.4二、0.36 分別說明上一分鐘、最後五分鐘以及最後十五分鐘的系統負載均值。那麼這又帶來了一個問題:

  咱們以哪一個數字爲準?一分鐘?五分鐘?仍是十五分鐘?

  其實對於這些數字咱們已經談論了不少,我認爲你應該着眼於五分鐘或者十五分鐘的平均數 值。坦白講,若是前一分鐘的負載狀況是 1.00,那麼仍能夠說明認定服務器狀況仍是正常的。 可是若是十五分鐘的數值仍然保持在 1.00,那麼就值得注意了(根據個人經驗,這時候你應該增長的處理器數量了)。

  那麼我如何得知個人系統裝備了多少核心的處理器?

  在Linux 下,可使用

  cat /proc/cpuinfo

  獲取你係統上的每一個處理器的信息。若是你只想獲得數字,那麼就使用下面的命令:

  grep 'model name' /proc/cpuinfo | wc -l

  Popularity: 11% [?]

  以上就是Linux系統Load average負載的內容。

相關文章
相關標籤/搜索