接觸過和使用過unix或linux的朋友,都知道如何查看Unix/Linux load的值,這邊我也重複一下查看load的方法:linux
[root@www.linuxidc.com ~]# uptime 13:33:37 up 7 days, 1:52, 1 user, load average: 4.15, 2.00, 3.14 [root@www.linuxidc.com ~]# w 13:35:35 up 1 days, 1:54, 1 user, load average: 0.00, 0.00, 0.00 USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT root pts/1 192.168.2.2 13:33 0.00s 0.02s 0.00s w
load average 後面三個值表明系統在1分鐘、5分鐘和15分鐘的負載狀況,都知道數字越高表示系統負載越大,第一直覺就是這個系統不行了。load average 是0的時候都認爲他很低,10的時候就以爲高,20就不用講了!可是除了這兩種極端的狀況以外,那何時是這兩個值的臨界點?當別人問起我這個問題的時 候,我也不知道如何回答,在我大腦裏就根本就沒有考慮過。困擾了我好久,我以爲要搞明白他!
bash
先從linux的kernel的源碼開始吧!在linux 2.6.36版本中有這樣一段代碼:ide
/** * spu_calc_load – update the avenrun load estimates. * * No locking against reading these values from userspace, as for * the CPU loadavg code. */ static void spu_calc_load(void) { unsigned long active_tasks; /* fixed-point */ active_tasks = count_active_contexts() * FIXED_1; CALC_LOAD(spu_avenrun[0], EXP_1, active_tasks); CALC_LOAD(spu_avenrun[1], EXP_5, active_tasks); CALC_LOAD(spu_avenrun[2], EXP_15, active_tasks); } CALC_LOAD是這樣定義: #define LOAD_FREQ (5*HZ+1) /* 5 sec intervals */ #define EXP_1 1884 /* 1/exp(5sec/1min) as fixed-point */ #define EXP_5 2014 /* 1/exp(5sec/5min) */ #define EXP_15 2037 /* 1/exp(5sec/15min) */#define CALC_LOAD(load,exp,n) \ load *= exp; \ load += n*(FIXED_1-exp); \ load >>= FSHIFT;
從這裏咱們能看到取負載值的最小週期5秒,根據代碼中定義咱們知道
spa
什麼是load?線程
load的就是必定時間內計算機有多少個active_tasks,也就是說是計算機的任務執行隊列的長度,cpu計算的隊列。unix
load多少是正常?code
既然load是cpu計算的隊列,那就應該和cpu個處理方式和cpu的個數有關係。因此我我的認爲應該按系統識別的cpu個數來肯定load的臨界值,系統識別爲8個cpu,那麼load爲8就是臨界點,高與8就屬於over load了。隊列
什麼叫系統識別cpu個數?進程
我是這樣認爲的,這裏涉及到cpu物理個數和超線程技術的問題。我的認爲4個物理cpu和2個雙核是不可以等同的,固然這是物理層面的事了!在系統裏識別的都是4個CPU.因此應該要以系統識別的爲準。畢竟是系統去支配他的使用。同步
CPU高不等同於load高
在Unix/Linux可能常常會遇到cpu的使用率爲100%,可是load卻不高!這是爲何呢?由於幾乎全部的任務和會和CPU進行交互,但 是因爲各個設備的使用頻率不一樣,形成了不能同步進行的問題。好比說,當對硬盤進行讀寫的時候,出現IO的等待時候,事實上cpu已經被切換到別的進程上 了。該任務就處於等待狀態,當這樣的任務過多,致使隊列長度過大,這樣就體現到負載過大了,但實際是此時cpu被分配去幹執行別的任務或空閒,所以CPU 高不等同於load高,load高也不能於cpu高。