Linux中vmstat命令詳解

時間 2019-11-10

原文原文鏈接

Vmstat命令詳解:

1、vmstat命令介紹

vmstat是Virtual Meomory Statistics（虛擬內存統計）的縮寫, 是實時系統監控工具。該命令經過使用knlist子程序和/dev/kmen僞設備驅動器訪問這些數據，輸出信息直接打印在屏幕。vmstat反饋的與CPU相關的信息包括：nginx

（1）多少任務在運行web

（2）CPU使用的狀況算法

（3）CPU收到多少中斷apache

（4）發生多少上下文切換ubuntu

2、vmstat運行原理

在系統中運行的每一個進程都須要使用到內存，但不是每一個進程都須要每時每刻使用系統分配的內存空間。當系統運行所需內存超過實際的物理內存，內核會釋放某些進程所佔用但未使用的部分或全部物理內存，將這部分資料存儲在磁盤上直到進程下一次調用，並將釋放出的內存提供給有須要的進程使用。緩存

在Linux內存管理中，主要是經過「調頁Paging」和「交換Swapping」來完成上述的內存調度。調頁算法是將內存中最近不常使用的頁面換到磁盤上，把活動頁面保留在內存中供進程使用。交換技術是將整個進程，而不是部分頁面，所有交換到磁盤上。服務器

分頁(Page)寫入磁盤的過程被稱做Page-Out，分頁(Page)從磁盤從新回到內存的過程被稱做Page-In。當內核須要一個分頁時，但發現此分頁不在物理內存中(由於已經被Page-Out了)，此時就發生了分頁錯誤（Page Fault）。併發

當系統內核發現可運行內存變少時，就會經過Page-Out來釋放一部分物理內存。經管Page-Out不是常常發生，可是若是Page-out頻繁不斷的發生，直到當內核管理分頁的時間超過運行程式的時間時，系統效能會急劇降低。這時的系統已經運行很是慢或進入暫停狀態，這種狀態亦被稱做thrashing(顛簸)。app

3、使用vmstat

1.用法

vmstat [-a] [-n] [-S unit] [delay [ count]]
函數

vmstat [-s] [-n] [-S unit]

vmstat [-m] [-n] [delay [ count]]

vmstat [-d] [-n] [delay [ count]]

vmstat [-p disk partition] [-n] [delay [ count]]

vmstat [-f]

vmstat [-V]

-a：顯示活躍和非活躍內存

-f：顯示從系統啓動至今的fork數量。

-m：顯示slabinfo

-n：只在開始時顯示一次各字段名稱。

-s：顯示內存相關統計信息及多種系統活動數量。

delay：刷新時間間隔。若是不指定，只顯示一條結果。

count：刷新次數。若是不指定刷新次數，但指定了刷新時間間隔，這時刷新次數爲無窮。

-d：顯示磁盤相關統計信息。

-p：顯示指定磁盤分區統計信息

-S：使用指定單位顯示。參數有 k 、K 、m 、M ，分別表明1000、102四、1000000、1048576字節（byte）。默認單位爲K（1024 bytes）

-V：顯示vmstat版本信息。

2.字段含義說明：

通常vmstat工具的使用是經過兩個數字參數來完成的，第一個參數是採樣的時間間隔數，單位是秒，第二個參數是採樣的次數，如:

root@ubuntu:~# vmstat  
procs -----------memory---------- ---swap-- -----io---- -system-- ----cpu----
 r  b   swpd   free   buff  cache   si   so    bi    bo      cs us sy id wa

2表示每一個兩秒採集一次服務器狀態，1表示只採集一次。

實際上，在應用過程當中，咱們會在一段時間內一直監控，不想監控直接結束vmstat就好了,例如:

root@ubuntu:~# vmstat   
procs -----------memory---------- ---swap-- -----io---- -system-- ----cpu----
 r  b   swpd   free   buff  cache   si   so    bi    bo      cs us sy id wa

這表示vmstat每2秒採集數據，一直採集，直到我結束程序，這裏採集了5次數據我就結束了程序。

好了，命令介紹完畢，如今開始實戰講解每一個參數的意思。

r 表示運行隊列(就是說多少個進程真的分配到CPU)，我測試的服務器目前CPU比較空閒，沒什麼程序在跑，當這個值超過了CPU數目，就會出現CPU瓶頸了。這個也和top的負載有關係，通常負載超過了3就比較高，超過了5就高，超過了10就不正常了，服務器的狀態很危險。top的負載相似每秒的運行隊列。若是運行隊列過大，表示你的CPU很繁忙，通常會形成CPU使用率很高。

b 表示阻塞的進程,這個很少說，進程阻塞，你們懂的。

swpd 虛擬內存已使用的大小，若是大於0，表示你的機器物理內存不足了，若是不是程序內存泄露的緣由，那麼你該升級內存了或者把耗內存的任務遷移到其餘機器。

free 空閒的物理內存的大小，個人機器內存總共8G，剩餘3415M。

buff Linux/Unix系統是用來存儲，目錄裏面有什麼內容，權限等的緩存，我本機大概佔用300多M

cache cache直接用來記憶咱們打開的文件,給文件作緩衝，我本機大概佔用300多M(這裏是Linux/Unix的聰明之處，把空閒的物理內存的一部分拿來作文件和目錄的緩存，是爲了提升程序執行的性能，當程序使用內存時，buffer/cached會很快地被使用。)

si 每秒從磁盤讀入虛擬內存的大小，若是這個值大於0，表示物理內存不夠用或者內存泄露了，要查找耗內存進程解決掉。個人機器內存充裕，一切正常。

so 每秒虛擬內存寫入磁盤的大小，若是這個值大於0，同上。

bi 塊設備每秒接收的塊數量，這裏的塊設備是指系統上全部的磁盤和其餘塊設備，默認塊大小是1024byte，我本機上沒什麼IO操做，因此一直是0，可是我曾在處理拷貝大量數據(2-3T)的機器上看過能夠達到140000/s，磁盤寫入速度差很少140M每秒

bo 塊設備每秒發送的塊數量，例如咱們讀取文件，bo就要大於0。bi和bo通常都要接近0，否則就是IO過於頻繁，須要調整。

in 每秒CPU的中斷次數，包括時間中斷

cs 每秒上下文切換次數，例如咱們調用系統函數，就要進行上下文切換，線程的切換，也要進程上下文切換，這個值要越小越好，太大了，要考慮調低線程或者進程的數目,例如在apache和nginx這種web服務器中，咱們通常作性能測試時會進行幾千併發甚至幾萬併發的測試，選擇web服務器的進程能夠由進程或者線程的峯值一直下調，壓測，直到cs到一個比較小的值，這個進程和線程數就是比較合適的值了。系統調用也是，每次調用系統函數，咱們的代碼就會進入內核空間，致使上下文切換，這個是很耗資源，也要儘可能避免頻繁調用系統函數。上下文切換次數過多表示你的CPU大部分浪費在上下文切換，致使CPU幹正經事的時間少了，CPU沒有充分利用，是不可取的。

us 用戶CPU時間，我曾經在一個作加密解密很頻繁的服務器上，能夠看到us接近100,r運行隊列達到80(機器在作壓力測試，性能表現不佳)。

sy 系統CPU時間，若是過高，表示系統調用時間長，例如是IO操做頻繁。

id 空閒 CPU時間，通常來講，id + us + sy = 100,通常我認爲id是空閒CPU使用率，us是用戶CPU使用率，sy是系統CPU使用率。

wa 等待IO CPU時間。