淺談Linux的內存管理機制

一 物理內存和虛擬內存linux

         咱們知道,直接從物理內存讀寫數據要比從硬盤讀寫數據要快的多,所以,咱們但願全部數據的讀取和寫入都在內存完成,而內存是有限的,這樣就引出了物理內存與虛擬內存的概念。
物理內存就是系統硬件提供的內存大小,是真正的內存,相對於物理內存,在linux下還有一個虛擬內存的概念,虛擬內存就是爲了知足物理內存的不足而提出的策略,它是利用磁盤空間虛擬出的一塊邏輯內存,用做虛擬內存的磁盤空間被稱爲交換空間(Swap Space)
         做爲物理內存的擴展,linux會在物理內存不足時,使用交換分區的虛擬內存,更詳細的說,就是內核會將暫時不用的內存塊信息寫到交換空間,這樣以來,物理內存獲得了釋放,這塊內存就能夠用於其它目的,當須要用到原始的內容時,這些信息會被從新從交換空間讀入物理內存。
         linux的內存管理採起的是分頁存取機制,爲了保證物理內存能獲得充分的利用,內核會在適當的時候將物理內存中不常用的數據塊自動交換到虛擬內存中,而將常用的信息保留到物理內存。
         要深刻了解linux內存運行機制,須要知道下面提到的幾個方面:
         首先,Linux系統會不時的進行頁面交換操做,以保持儘量多的空閒物理內存,即便並無什麼事情須要內存,Linux也會交換出暫時不用的內存頁面。這能夠避免等待交換所需的時間。
         其次,linux進行頁面交換是有條件的,不是全部頁面在不用時都交換到虛擬內存,linux內核根據」最近最常用「算法,僅僅將一些不常用的頁面文件交換到虛擬內存,有時咱們會看到這麼一個現象:linux物理內存還有不少,可是交換空間也使用了不少。其實,這並不奇怪,例如,一個佔用很大內存的進程運行時,須要耗費不少內存資源,此時就會有一些不經常使用頁面文件被交換到虛擬內存中,但後來這個佔用不少內存資源的進程結束並釋放了不少內存時,剛纔被交換出去的頁面文件並不會自動的交換進物理內存,除非有這個必要,那麼此刻系統物理內存就會空閒不少,同時交換空間也在被使用,就出現了剛纔所說的現象了。關於這點,不用擔憂什麼,只要知道是怎麼一回事就能夠了。
         最後,交換空間的頁面在使用時會首先被交換到物理內存,若是此時沒有足夠的物理內存來容納這些頁面,它們又會被立刻交換出去,如此以來,虛擬內存中可能沒有足夠空間來存儲這些交換頁面,最終會致使linux出現假死機、服務異常等問題,linux雖然能夠在一段時間內自行恢復,可是恢復後的系統已經基本不可用了。
所以,合理規劃和設計linux內存的使用,是很是重要的.
算法

二 內存的監控
         做爲一名linux系統管理員,監控內存的使用狀態是很是重要的,經過監控有助於瞭解內存的使用狀態,好比內存佔用是否正常,內存是否緊缺等等,監控內存最常使用的命令有free、top等,下面是某個系統free的輸出:
[haixigov@WEBServer ~]$ free
             total        used         free      shared   buffers   cached
Mem:         16402432    16360492      41940        0     465404   12714880
-/+ buffers/cache:        3180208   13222224
Swap:        8193108        264      8192844
咱們解釋下輸出結果中每一個選項的含義:
首先是第一行:
 total:物理內存的總大小。 
 used:已經使用的物理內存多小。 
 free:空閒的物理內存值。 
 shared:多個進程共享的內存值。
 buffers/cached:磁盤緩存的大小。 
第二行Mem:表明物理內存使用狀況。
第三行(-/+ buffers/cached):表明磁盤緩存使用狀態。
第四行:Swap表示交換空間內存使用狀態。
free命令輸出的內存狀態,能夠經過兩個角度來查看:一個是從內核的角度來看,一個是從應用層的角度來看的。 
 
緩存

1.從內核的角度來查看內存的狀態
就是內核目前能夠直接分配到,不須要額外的操做,即爲上面free命令輸出中第二行Mem項的值,能夠看出,此係統物理內存有16G,空閒的內存只有41940K,也就是40M多一點,咱們來作一個這樣的計算:
16402432-16360492=41940  
其實就是總的物理內存減去已經使用的物理內存獲得的就是空閒的物理內存大小,注意這裏的可用內存值41940並不包含處於buffers和cached狀態的內存大小。
若是你認爲這個系統空閒內存過小,那你就錯了,實際上,內核徹底控制着內存的使用狀況,linux會在須要內存的時候,或在系統運行逐步推動時,將buffers和cached狀態的內存變爲free狀態的內存,以供系統使用。 
 
服務器

2.從應用層的角度來看系統內存的使用狀態
也就是linux上運行的應用程序可使用的內存大小,即free命令第三行「(-/+ buffers/cached)」的輸出,能夠看到,此係統已經使用的內存才3180208K,而空閒的內存達到13222224K,繼續作這樣一個計算:
41940+(465404+12714880)=13222224
經過這個等式可知,應用程序可用的物理內存值是Mem項的free值加上buffers和cached值之和,也就是說,這個free值是包括buffers和cached項大小的,
對於應用程序來講,buffers/cached佔有的內存是可用的,由於buffers/cached是爲了提升文件讀取的性能,當應用程序須要用到內存的時候,buffers/cached會很快地被回收,以供應用程序使用。
 
網絡

3.buffers與cached的異同
 在 Linux 操做系統中,當應用程序須要讀取文件中的數據時,操做系統先分配一些內存,將數據從磁盤讀入到這些內存中,而後再將數據分發給應用程序;當須要往文件中寫數據時,操做系統先分配內存接收用戶數據,而後再將數據從內存寫到磁盤上。然而,若是有大量數據須要從磁盤讀取到內存或者由內存寫入磁盤時,系統的讀寫性能就變得很是低下,由於不管是從磁盤讀數據,仍是寫數據到磁盤,都是一個很消耗時間和資源的過程,在這種狀況下,linux引入了buffers和cached機制。
buffers與cached都是內存操做,用來保存系統曾經打開過的文件以及文件屬性信息,這樣當操做系統須要讀取某些文件時,會首先在buffers與cached內存區查找,若是找到,直接讀出傳送給應用程序,若是沒有找到須要數據,才從磁盤讀取,這就是操做系統的緩存機制,經過緩存,大大提升了操做系統的性能。但buffers與cached緩衝的內容倒是不一樣的。
buffers是用來緩衝塊設備作的,它只記錄文件系統的元數據(metadata)以及 tracking in-flight pages,而cached是用來給文件作緩衝。更通俗一點說:buffers主要用來存放目錄裏面有什麼內容,文件的屬性以及權限等等。而cached直接用來記憶咱們打開過的文件和程序。
爲了驗證咱們的結論是否正確,能夠經過vi打開一個很是大的文件,看看cached的變化,而後再次vi這個文件,感受一下兩次打開的速度有何異同,是否是第二次打開的速度明顯快於第一次呢?
接着執行下面的命令:
 find /* -name  *.conf
         看看buffers的值是否變化,而後重複執行find命令,看看兩次顯示速度有何不一樣。
         Linux操做系統的內存運行原理,很大程度上是根據服務器的需求來設計的,例如系統的緩衝機制會把常用到的文件和數據緩存在cached中,linux老是在力求緩存更多的數據和信息,這樣再次須要這些數據時能夠直接從內存中取,而不須要有一個漫長的磁盤操做,這種設計思路提升了系統的總體性能。
性能

三 交換空間swap的使用
        雖然如今的內存已經變得很是廉價,可是swap仍然有很大的使用價值,合理的規劃和使用swap分區,對系統穩定運行相當重要。Linux下可使用文件系統中的一個常規文件或者一個獨立分區做爲交換空間使用。同時linux容許使用多個交換分區或者交換文件。
 
spa

1.建立swap交換空間
         建立交換空間所需的交換文件是一個普通的文件,可是,建立交換文件與建立普通文件不一樣,必須經過dd命令來完成,同時這個文件必須位於本地硬盤上,不能在網絡文件系統(NFS)上建立swap交換文件。例如:
[root@localhost ~]# dd if=/dev/zero of=/data/swapfile bs=1024 count=65536
65536+0 records in
65536+0 records out
這樣就建立一個有連續空間的交換文件,大小爲60M左右,關於dd命令作簡單的講述:
if=輸入文件,或者設備名稱。
of=輸出文件或者設備名稱。
ibs=bytes 表示一次讀入bytes 個字節(即一個塊大小爲 bytes 個字節)。
obs=bytes 表示一次寫bytes 個字節(即一個塊大小爲 bytes 個字節)。
bs=bytes,同時設置讀寫塊的大小,以bytes爲單位,此參數可代替 ibs 和 obs。
count=blocks 僅拷貝blocks個塊。
skip=blocks 表示從輸入文件開頭跳過 blocks 個塊後再開始複製。
seek=blocks表示從輸出文件開頭跳過 blocks 個塊後再開始複製。(一般只有當輸出文件是磁盤或磁帶時纔有效)
這裏的輸入設備/dev/zero表明一個輸出永遠爲0的設備文件,使用它做輸入能夠獲得全爲空的文件。
 
操作系統

2.激活和使用swap
首先經過mkswap命令指定做爲交換空間的設備或者文件:
[root@localhost ~]#mkswap  /data/swapfile
Setting up swapspace version 1, size = 67104 kB
[root@localhost backup]# free
             total       used       free     shared    buffers     cached
Mem:       2066632    1998188      68444          0      26160    1588044
-/+ buffers/cache:     383984    1682648
Swap:      4088500     101036    3987464
從上面輸出可知,咱們指定了一個67104 kB的交換空間,而此時新建的交換空間還未被使用,下面簡單介紹下mkswap命令,mkswap的通常使用格式爲:
mkswap [參數] [設備名稱或文件][交換區大小]
參數:
-c:創建交換區前,先檢查是否有損壞的區塊。
-v0:創建舊式交換區,此爲預設值。
-v1:創建新式交換區。
交換區大小:指定交換區的大小,單位爲1024字節。
設置交換分區後,接着經過swapon命令激活swap:
[root@localhost ~]#/usr/sbin/swapon /data/swapfile
[root@localhost backup]# free
             total       used       free     shared    buffers     cached
Mem:       2066632    1997668      68964          0      27404    1588880
-/+ buffers/cache:     381384    1685248
Swap:      4154028     100976    4053052
         經過free命令能夠看出,swap大小已經由4088500k變爲4154028k,相差的值是60M左右,恰好等於咱們增長的一個交換文件大小,這說明新增的交換分區已經可使用了,可是若是linux重啓,那麼新增的swap空間將變得不可用,所以須要在/etc/fstab中添加自動加載設置:
 /data/swapfile  none  swap  sw 0 0
如此以來,linux在重啓後就能夠實現自動加載swap分區了。其實linux在啓動過程當中會執行「swapon -a」命令,此命令會加載列在/etc/fstab中的全部交換空間。
 
設計

3.移除swap
經過swapoff便可移除一個交換空間
[root@localhost ~]#/usr/sbin/swapoff /data/swapfile
其實也能夠經過「swapoff -a」移除在/etc/fstab中定義的全部交換空間,這裏的「swapoff -a」與上面提到的「swapon -a」對應。執行「swapoff -a」後,free命令輸出以下:
[root@localhost backup]# free
             total       used       free     shared    buffers     cached
Mem:       2066632    2048724      17908          0      30352    1642748
-/+ buffers/cache:     375624    1691008
Swap:            0          0          0
進程

相關文章
相關標籤/搜索