/proc文件系統是一個僞文件系統,它只存在內存當中,而不佔用外存空間。它以文件系統的方式爲內核與進程提供通訊的接口。用戶和應用程序能夠經過/proc獲得系統的信息,並能夠改變內核的某些參數。因爲系統的信息,如進程,是動態改變的,因此用戶或應用程序讀取/proc目錄中的文件時,proc文件系統是動態從系統內核讀出所需信息並提交的。html
/proc目錄中有一些以數字命名的目錄,它們是進程目錄。系統中當前運行的每個進程在/proc下都對應一個以進程號爲目錄名的目錄/proc/pid,它們是讀取進程信息的接口。此外,在Linux 2.6.0-test6以上的版本中/proc/pid目錄中有一個task目錄,/proc/pid/task目錄中也有一些以該進程所擁有的線程的線程號命名的目錄/proc/pid/task/tid,它們是讀取線程信息的接口。java
該文件中存放了有關 cpu的相關信息(型號,緩存大小等)。linux
[zhengangen@buick ~]$ cat /proc/cpuinfo算法
processor : 0shell
vendor_id : GenuineIntelexpress
cpu family : 15api
model : 4緩存
model name : Intel(R) Xeon(TM) CPU 3.00GHzapp
stepping : 10less
cpu MHz : 3001.177
cache size : 2048 KB
physical id : 0
siblings : 2
core id : 0
cpu cores : 1
fdiv_bug : no
hlt_bug : no
f00f_bug : no
coma_bug : no
fpu : yes
fpu_exception : yes
cpuid level : 5
wp : yes
flags : fpu vme de pse tsc msr pae mce cx8 apic mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe lm pni monitor ds_cpl cid xtpr
bogomips : 6004.52
說明:如下只解釋對咱們計算Cpu使用率有用的相關參數。
參數 解釋
processor (0) cpu的一個物理標識
結論1:能夠經過該文件根據processor出現的次數統計cpu的邏輯個數(包括多核、超線程)。
該文件包含了全部CPU活動的信息,該文件中的全部值都是從系統啓動開始累計到當前時刻。不一樣內核版本中該文件的格式可能不大一致,如下經過實例來講明數據該文件中各字段的含義。
實例數據:2.6.24-24版本上的
fjzag@fjzag-desktop:~$ cat /proc/stat
cpu 38082 627 27594 893908 12256 581 895 0 0
cpu0 22880 472 16855 430287 10617 576 661 0 0
cpu1 15202 154 10739 463620 1639 4 234 0 0
intr 120053 222 2686 0 1 1 0 5 0 3 0 0 0 47302 0 0 34194 29775 0 5019 845 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
ctxt 1434984
btime 1252028243
processes 8113
procs_running 1
procs_blocked 0
第一行的數值表示的是CPU總的使用狀況,因此咱們只要用第一行的數字計算就能夠了。下表解析第一行各數值的含義:
參數 解析(單位:jiffies)
(jiffies是內核中的一個全局變量,用來記錄自系統啓動一來產生的節拍數,在linux中,一個節拍大體可理解爲操做系統進程調度的最小時間片,不一樣linux內核可能值有不一樣,一般在1ms到10ms之間)
user (38082) 從系統啓動開始累計到當前時刻,處於用戶態的運行時間,不包含 nice值爲負進程。
nice (627) 從系統啓動開始累計到當前時刻,nice值爲負的進程所佔用的CPU時間
system (27594) 從系統啓動開始累計到當前時刻,處於核心態的運行時間
idle (893908) 從系統啓動開始累計到當前時刻,除IO等待時間之外的其它等待時間iowait (12256) 從系統啓動開始累計到當前時刻,IO等待時間(since 2.5.41)
irq (581) 從系統啓動開始累計到當前時刻,硬中斷時間(since 2.6.0-test4)
softirq (895) 從系統啓動開始累計到當前時刻,軟中斷時間(since 2.6.0-test4)stealstolen(0) which is the time spent in other operating systems when running in a virtualized environment(since 2.6.11)
guest(0) which is the time spent running a virtual CPU for guest operating systems under the control of the Linux kernel(since 2.6.24)
結論2:總的cpu時間totalCpuTime = user + nice + system + idle + iowait + irq + softirq + stealstolen + guest
該文件包含了某一進程全部的活動的信息,該文件中的全部值都是從系統啓動開始累計
到當前時刻。如下經過實例數據來講明該文件中各字段的含義。
[zhengangen@buick ~]# cat /proc/6873/stat
6873 (a.out) R 6723 6873 6723 34819 6873 8388608 77 0 0 0 41958 31 0 0 25 0 3 0 5882654 1409024 56 4294967295 134512640 134513720 3215579040 0 2097798 0 0 0 0 0 0 0 17 0 0 0
說明:如下只解釋對咱們計算Cpu使用率有用相關參數
參數 解釋
pid=6873 進程號
utime=1587 該任務在用戶態運行的時間,單位爲jiffies
stime=41958 該任務在覈心態運行的時間,單位爲jiffies
cutime=0 全部已死線程在用戶態運行的時間,單位爲jiffies
cstime=0 全部已死在覈心態運行的時間,單位爲jiffies
結論3:進程的總Cpu時間processCpuTime = utime + stime + cutime + cstime,該值包括其全部線程的cpu時間。
該文件包含了某一進程全部的活動的信息,該文件中的全部值都是從系統啓動開始累計到當前時刻。該文件的內容格式以及各字段的含義同/proc/<pid>/stat文件。
注意,該文件中的tid字段表示的再也不是進程號,而是linux中的輕量級進程(lwp),即咱們一般所說的線程。
結論4:線程Cpu時間threadCpuTime = utime + stime
經過ps命令能夠查看系統中相關進程的Cpu使用率的信息。如下在linux man文檔中對ps命令輸出中有關cpu使用率的解釋:
CPU usage is currently expressed as the percentage of time spent running during the entire lifetime of a process. This is not ideal, and it does not conform to the standards that ps otherwise conforms to. CPU usage is unlikely to add up to exactly 100%.
%cpu cpu utilization of the process in "##.#" format. It is the CPU time used divided by the time the process has been running (cputime/realtime ratio), expressed as a percentage. It will not add up to 100% unless you are lucky.
結論5:ps命令算出來的cpu使用率相對於進程啓動時的平均值,隨着進程運行時間的增大,該值會趨向於平緩。
經過top命令能夠查看系統中相關進程的實時信息(cpu使用率等)。如下是man文檔中對top命令輸出中有關進程cpu使用率的解釋。
#C -- Last used CPU (SMP) A number representing the last used processor. In a true SMP environment this will likely change frequently since the kernel intentionally uses weak affinity. Also, the very act of running top may break this weak affinity and cause more processes to change CPUs more often (because of the extra demand for cpu time).
%CPU -- CPU usage The task’s share of the elapsed CPU time since the last screen update, expressed as a percent-age of total CPU time. In a true SMP environment, if Irix mode is Off, top will operate in Solaris mode where a task’s cpu usage will be divided by the total number of CPUs.
結論6:某一個線程在其運行期間其所使用的cpu可能會發生變化。
結論7:在多核的狀況下top命令輸出的cpu使用率實質是按cpu個數*100%計算的。<!--[if !supportAnnotations]-->
經過讀取/proc/stat 、/proc/<pid>/stat、/proc/<pid>/task/<tid>/stat以及/proc/cpuinfo這幾個文件獲取總的Cpu時間、進程的Cpu時間、線程的Cpu時間以及Cpu的個數的信息,而後經過必定的算法進行計算(採樣兩個足夠短的時間間隔的Cpu快照與進程快照來計算進程的Cpu使用率)。
<!--[if !supportLists]-->一、 <!--[endif]-->採樣兩個足夠短的時間間隔的Cpu快照,分別記做t1,t2,其中t一、t2的結構均爲:
(user、nice、system、idle、iowait、irq、softirq、stealstolen、guest)的9元組;
<!--[if !supportLists]-->二、 <!--[endif]-->計算總的Cpu時間片totalCpuTime
<!--[if !supportLists]-->a) <!--[endif]-->把第一次的全部cpu使用狀況求和,獲得s1;
<!--[if !supportLists]-->b) <!--[endif]-->把第二次的全部cpu使用狀況求和,獲得s2;
<!--[if !supportLists]-->c) <!--[endif]-->s2 - s1獲得這個時間間隔內的全部時間片,即totalCpuTime = j2 - j1 ;
三、計算空閒時間idle
idle對應第四列的數據,用第二次的第四列 - 第一次的第四列便可
idle=第二次的第四列 - 第一次的第四列
六、計算cpu使用率
pcpu =100* (total-idle)/total
<!--[if !supportLists]-->1. <!--[endif]-->採樣兩個足夠短的時間間隔的cpu快照與進程快照,
<!--[if !supportLists]-->a) <!--[endif]-->每個cpu快照均爲(user、nice、system、idle、iowait、irq、softirq、stealstolen、guest)的9元組;
<!--[if !supportLists]-->b) <!--[endif]-->每個進程快照均爲 (utime、stime、cutime、cstime)的4元組;
<!--[if !supportLists]-->2. <!--[endif]-->分別根據結論2、結論3計算出兩個時刻的總的cpu時間與進程的cpu時間,分別記做:totalCpuTime1、totalCpuTime2、processCpuTime1、processCpuTime2
<!--[if !supportLists]-->3. <!--[endif]-->計算該進程的cpu使用率pcpu = 100*( processCpuTime2 – processCpuTime1) / (totalCpuTime2 – totalCpuTime1) (按100%計算,若是是多核狀況下還需乘以cpu的個數);
實驗一: 監控一空循環的進程的cpu使用率。 |
|
說明:左邊的數據是按以上算法獲得的數據,其中採樣的時間間隔與top命令刷新屏幕的時間間隔相同。 |
|
按以上方法計算獲得的cpu使用率 |
經過top命令獲得的 |
99.50083 98.333336 98.0 98.83138 99.0 99.0 99.83361 98.83527 98.4975
|
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND 7639 fjzag 20 0 206m 10m 7136 S 99 2.2 1:00.74 java 7639 fjzag 20 0 206m 10m 7136 S 99 2.2 1:03.71 java 7639 fjzag 20 0 206m 10m 7136 S 99 2.2 1:06.67 java 7639 fjzag 20 0 206m 10m 7136 S 99 2.2 1:09.63 java 7639 fjzag 20 0 206m 10m 7136 S 98 2.2 1:12.59 java 7639 fjzag 20 0 206m 10m 7136 S 99 2.2 1:15.55 java 7639 fjzag 20 0 206m 10m 7136 S 100 2.2 1:18.55 java 7639 fjzag 20 0 206m 10m 7136 S 100 2.2 1:21.54 java 7639 fjzag 20 0 206m 10m 7136 S 99 2.2 1:24.52 java 7639 fjzag 20 0 206m 10m 7136 S 98 2.2 1:27.46 java |
實驗二: 監控jconsole進程的cpu使用率。 |
|
說明:左邊的數據是按以上算法獲得的數據,其中採樣的時間間隔與top命令刷新屏幕的時間間隔相同。 |
|
按以上方法計算獲得的cpu使用率 |
經過top命令獲得的 |
8.681135 12.0 10.350584 7.6539097 7.6539097 5.0 13.021703 11.0 8.666667 |
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND 7753 fjzag 20 0 252m 72m 22m S 10 14.4 0:18.70 jconsole 7753 fjzag 20 0 252m 72m 22m S 12 14.4 0:19.07 jconsole 7753 fjzag 20 0 252m 72m 22m S 11 14.4 0:19.39 jconsole 7753 fjzag 20 0 252m 72m 22m S 7 14.4 0:19.61 jconsole 7753 fjzag 20 0 252m 72m 22m S 7 14.4 0:19.83 jconsole 7753 fjzag 20 0 252m 72m 22m S 5 14.4 0:19.97 jconsole 7753 fjzag 20 0 252m 72m 22m S 14 14.4 0:20.38 jconsole 7753 fjzag 20 0 252m 72m 22m S 10 14.4 0:20.68 jconsole 7753 fjzag 20 0 252m 72m 22m S 9 14.5 0:20.96 jconsole |
<!--[if !supportLists]-->1. <!--[endif]-->採樣兩個足夠短的時間隔的cpu快照與線程快照,
<!--[if !supportLists]-->a) <!--[endif]-->每個cpu快照均爲(user、nice、system、idle、iowait、irq、softirq、stealstealon、guest)的9元組;
<!--[if !supportLists]-->b) <!--[endif]-->每個線程快照均爲 (utime、stime)的2元組;
<!--[if !supportLists]-->2. <!--[endif]-->分別根據結論2、結論4計算出兩個時刻的總的cpu時間與線程的cpu時間,分別記做:totalCpuTime1、totalCpuTime2、threadCpuTime1、threadCpuTime2
<!--[if !supportLists]-->3. <!--[endif]-->計算該線程的cpu使用率pcpu = 100*( threadCpuTime2 – threadCpuTime1) / (totalCpuTime2 – totalCpuTime1) (按100%計算,若是是多核狀況下還需乘以cpu的個數);
實驗一: 監控一空循環的線程的cpu使用率。 |
|
說明:左邊的數據是按以上算法獲得的數據,其中採樣的時間間隔與top命令刷新屏幕的時間間隔相同。 |
|
按以上方法計算獲得的cpu使用率 |
經過top命令獲得的 |
98.83138 97.00997 96.98997 97.49583 98.169716 96.8386 97.333336 93.82304 98.66667 |
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND 7649 fjzag 20 0 206m 10m 7136 R 97 2.2 7:22.94 java 7649 fjzag 20 0 206m 10m 7136 R 97 2.2 7:25.86 java 7649 fjzag 20 0 206m 10m 7136 R 97 2.2 7:28.76 java 7649 fjzag 20 0 206m 10m 7136 R 99 2.2 7:31.72 java 7649 fjzag 20 0 206m 10m 7136 R 98 2.2 7:34.65 java 7649 fjzag 20 0 206m 10m 7136 R 96 2.2 7:37.53 java 7649 fjzag 20 0 206m 10m 7136 R 98 2.2 7:40.47 java 7649 fjzag 20 0 206m 10m 7136 R 96 2.2 7:43.34 java 7649 fjzag 20 0 206m 10m 7136 R 97 2.2 7:46.25 java |
實驗二: 監控jconsole程序某一線程的cpu使用率。 |
|
說明:左邊的數據是按以上算法獲得的數據,其中採樣的時間間隔與top命令刷新屏幕的時間間隔相同。 |
|
按以上方法計算獲得的cpu使用率 |
經過top命令獲得的 |
1.3400335 6.644518 1.3333334 0.6677796 0.6666667 1.3333334 1.3333334 |
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND 7755 fjzag 20 0 251m 72m 22m S 1 14.4 0:11.92 jconsole 7755 fjzag 20 0 251m 72m 22m S 7 14.4 0:12.12 jconsole 7755 fjzag 20 0 251m 72m 22m S 2 14.4 0:12.18 jconsole 7755 fjzag 20 0 251m 72m 22m S 0 14.4 0:12.18 jconsole 7755 fjzag 20 0 251m 72m 22m S 1 14.4 0:12.20 jconsole 7755 fjzag 20 0 251m 72m 22m S 1 14.4 0:12.24 jconsole 7755 fjzag 20 0 251m 72m 22m S 1 14.4 0:12.28 jconsole |
如下經過實驗數據來講明多核狀況下某一進程cpu使用率是按cpu個數*100%計算的.
在雙核的狀況下做的一組實驗,第一組數據是經過ps -eLo pid,lwp,pcpu | grep 9140命令查看進程號爲9140的進程中各線程的詳細信息。第二組數據是經過 ps命令查看進程號爲9140進程的cpu使用率。
pid lwp %cpu
9140 9140 0.0
9140 9141 0.0
9140 9142 0.0
9140 9143 0.0
9140 9144 0.0
9140 9149 0.0
9140 9150 0.0
9140 9151 0.0
9140 9152 0.1
9140 9153 96.6 該線程是一個空循環
9140 9154 95.9 該線程是一個空循環
以上除了紅色標註出來的兩個線程之外,其餘的線程都是後臺線程。
pid %cpu
9140 193
在單核的狀況下做的一組實驗,第一組數據是經過ps -eLo pid,lwp,pcpu | grep 6137命令查看進程號爲6137的進程中各線程的詳細信息。第二組數據是經過 ps命令查看進程號爲6137進程的cpu使用率。
pid lwp %cpu
6137 6137 0.0
6137 6138 0.1
6137 6143 0.0
6137 6144 0.0
6137 6145 0.0
6137 6146 0.0
6137 6147 0.0
6137 6148 0.0
6137 6149 0.0
6137 6150 46.9 空循環線程
6137 6151 46.9 空循環線程
以上除了紅色標註出來的兩個線程之外,其餘的線程都是後臺線程。
pid %cpu
6137 92.9
<!--[if !supportLists]-->1. <!--[endif]-->不一樣內核版本/proc/stat文件格式不大一致。/proc/stat文件中第一行爲總的cpu使用狀況。
各個版本都有的4個字段: user、nice、system、idle
2.5.41版本新增字段:iowait
2.6.0-test4新增字段:irq、softirq
2.6.11新增字段:stealstolen : which is the time spent in other operating
systems when running in a virtualized environment
2.6.24新增字段:guest: which is the time spent running a virtual CPU for guest operating systems under the control of the Linux kernel
2./proc/pid/task目錄是Linux 2.6.0-test6以後纔有的功能。
3.關於出現cpu使用率爲負的狀況,目前想到的解決方案是若是出現負值,連續採樣計算cpu使用率直到爲非負。
4. 有些線程生命週期較短,可能在咱們採樣期間就已經死掉了.