Linux 系統內存分析

1. 內存基本介紹linux

1.計算機基本結構:算法

電腦之父——馮·諾伊曼提出了計算機的五大部件:輸入設備、輸出設備、存儲器、運算器和控制器數組

如圖:

輸入設備:鍵盤鼠標等緩存

CPU:是計算機的運算核心和控制核心,讓電腦的各個部件順利工做,起到協調和控制做用。安全

存儲器:一系列的存儲設備,硬盤,內存等併發

輸出設備:如打印機,揚聲器等函數

2.存儲器:性能

咱們看一下系統中存儲器的層次結構:學習

圖中L0-L5分別表示系統中全部存儲器的層次結構,其中包括高速緩存,主存,磁盤等。 越上層的存儲器造價越高,速度也越快,也更加靠近cpu。 正常狀況下,咱們在開發應用程序時,使用的是主存(L3)。優化

在開發應用程序時,咱們接觸最多的應該是內存和磁盤文件,也知道訪問磁盤存儲器的時候,須要進行I/O操做,相比內存十分耗時間,那二者具體相差多少,咱們能夠看一下下面這一段描述(DRAM爲主存):

也就是說,在這個例子裏面,磁盤訪問時間是內存的10萬倍,固然,數據不是絕對的,在不一樣狀況下,數據應該會存在誤差,咱們大概有個概念就能夠。

3.內存和磁盤的主要做用:

硬盤:存儲資料和軟件等數據的設備,有容量大,斷電數據不丟失的特色。也被人們稱之爲「數據倉庫」。

內存:1. cpu沒法直接訪問硬盤,必須經過內存,所以內存一個做用是負責硬盤等硬件上的數據與CPU之間數據交換處理;2. 緩存系統中的臨時數據。3. 斷電後數據會丟失。

2. Linux 系統內存管理

一. 物理尋址與虛擬尋址

計算機系統的主存(內存)被組織成一個由M個連續的字節大小的單元組成的數組。每一個字節都擁有惟一的物理地址,cpu直接對物理地址進行尋址稱爲物理尋址,很早期的pc使用的是物理尋址,示意圖以下:

![](https://img2018.cnblogs.com/blog/1285081/201809/1285081-20180913205739559-677743272.png)

爲通用計算設計的現代處理器使用的是虛擬尋址。根據虛擬尋址,cpu在訪問主存以前,需將虛擬地址轉換成物理地址(經過地址翻譯MMU)。示意圖以下:

![](https://img2018.cnblogs.com/blog/1285081/201809/1285081-20180913212138761-556862785.png)

也就是說,在虛擬尋址的系統中,一個數據對象擁有兩個地址空間,關於地址空間,咱們看一下下面這一段話:

![](https://img2018.cnblogs.com/blog/1285081/201809/1285081-20180913212622359-81420563.png)

那這兩個地址空間多大呢? 首先,咱們知道一個32位的系統,每個地址對應的數據空間爲32位,也就是4個字節。一個地址用32位二進制表示,那麼全部地址的可能性就是爲2的32次方,大小爲4G。所以,虛擬地址的地址空間和物理地址的地址空間取決於虛擬地址和物理地址的位數

二. 系統引入虛擬地址的緣由

咱們以Linux系統爲例,來解釋一下爲何要引入虛擬地址,直接用物理地址不是更快嗎? 最根本的緣由是由於Linux系統是一個多任務系統,而虛擬地址能夠很好的保證系統進程的併發性,獨立性。

Linux 進程內存分配結構圖(緣由中有涉及):

![](https://img2018.cnblogs.com/blog/1285081/201809/1285081-20180913224755081-361175982.png)

緣由:

1. 簡化存儲器管理。每一個進程一個獨立頁表,獨立虛擬地址空間

![](https://img2018.cnblogs.com/blog/1285081/201809/1285081-20180913231746608-1094080270.png)

1.1. 簡化連接。由於進程虛擬地址空間獨立,以32位系統爲例,每一個進程分配的虛擬內存均爲4G,其中堆段,棧,數據段,代碼段各自所在的位置是一致的,這樣能夠簡化連接器的設計與實現。如圖:10.10

![](https://img2018.cnblogs.com/blog/1285081/201809/1285081-20180913224114047-2128963268.png)

1.2. 簡化共享。通常而言,每一個進程都有本身私有代碼,數據,堆以及棧區域,是不和其餘進程共享的,那這時候就須要多個物理頁面來進行存儲,可是在一些狀況下,仍是會須要進程之間來共享代碼和數據。例如:操做系統的內核代碼,c程序中的標準庫代碼,好比printf。操做系統將不一樣進程中適當的虛擬頁面映射到相同的物理頁面,從而達到多個進程共享這部分代碼的一個拷貝。而不是在每一個進程中都包括單獨的內核和c標準庫拷貝。

1.3. 簡化存儲器分配。分配的物理頁面能夠不連續。

![](https://img2018.cnblogs.com/blog/1285081/201809/1285081-20180913230154175-564195183.png)

1.4. 簡化加載。 和連接差很少,進程加載elf文件到存儲器的虛擬地址是相同的。

![](https://img2018.cnblogs.com/blog/1285081/201809/1285081-20180913233641638-1415734783.png)

2. 保護存儲器。控制用戶進程對存儲器的訪問,對某些特殊區段,用戶進程禁止訪問修改,保證安全性和獨立性

![](https://img2018.cnblogs.com/blog/1285081/201809/1285081-20180914194605600-860702946.png)

三. 虛擬存儲系統如何工做

同任何緩存同樣,虛擬存儲系統必須有某種方法來斷定一個虛擬頁是否存在於DRAM中,若是存在,還須要肯定這個虛擬頁存放在哪一個物理頁。若是沒用命中,系統必須判斷這個虛擬頁存放在磁盤哪一個位置,在物理頁中選擇一個犧牲頁,並將虛擬頁拷貝到DRAM,替換這個犧牲頁。要完成這部分工做,須要哪些角色參與進來呢? 看下面介紹:

![](https://img2018.cnblogs.com/blog/1285081/201809/1285081-20180914201016633-10598612.png)

看上圖,能夠清楚到看到,虛擬內存是如何映射到物理地址和磁盤的。下面咱們來介紹一個概念頁命中,當cpu從虛擬內存中讀取一個字節,若是經過頁表能夠成功映射到物理存儲器,則稱爲頁命中,具體見下圖:

若是虛擬頁沒有映射到物理內存,而是映射到磁盤,那這種現象就叫作缺頁。這時候,地址翻譯硬件,判斷虛擬頁未緩存到DRAM中,而後會觸發一個缺頁異常(也叫缺頁中斷)。將虛擬頁從新映射到DRAM。 在磁盤與存儲器之間傳送頁的活動叫作頁面調度,涉及的算法叫頁面置換算法(如:OPT,FIFO,LRU) 。 缺頁中斷過程以下。

缺頁前:

![](https://img2018.cnblogs.com/blog/1285081/201809/1285081-20180914203707528-1016053388.png)

缺頁後:

![](https://img2018.cnblogs.com/blog/1285081/201809/1285081-20180914203748691-1852269972.png)

Linux系統層面的內存管理調度大概就介紹到這裏,下面咱們進入進程層面的內存分析!

3. Linux 進程級內存管理

首先,咱們再次把進程的空間結構圖附上:

![](https://img2018.cnblogs.com/blog/1285081/201809/1285081-20180914210926227-1458829308.png)

一. 內核態和用戶態

咱們知道程序訪問的地址都是虛擬地址,用32位操做系統來說,系統訪問的地址空間爲4G,linux會將4G分爲兩部分,如上圖所示,其中從0x00000000 到 0xbfffffff的線性地址爲用戶空間,0xc0000000 到 0xffffffff爲內核空間

進程在用戶態只能訪問0~3G,只有進入內核態才能訪問3G~4G

用戶空間:在Linux中,每一個用戶進程均可以訪問4GB的線性虛擬內存空間。其中從0到3GB的虛存地址是用戶空間,經過每一個進程本身的頁目錄、頁表,用戶進程能夠直接訪問。

內核空間:從3GB到4GB的虛存地址爲內核態空間,存放供內核訪問的代碼和數據,用戶態進程不能訪問,也就是說對於用戶代碼來講是不可見的,只有內核態進程才能尋址。全部進程從3GB到4GB的虛擬空間都是同樣的,linux以此方式讓內核態進程共享代碼段和數據段。(頁表就存放在內核虛擬空間)

二. 進程用戶態空間

若是不是作內核開發,在寫代碼的過程當中,咱們主要涉及到的是用戶態空間,在代碼層面能夠進行優化和分析的也是用戶態空間,內核空間主要由系統進行管理,所以咱們着重介紹一下用戶態空間,至於內核空間,其中可能涉及到一些比較好的算法思路(夥伴,slab等),若是有時間能夠單獨去學習其思想。

程序空間

1. 堆段

對於堆段,程序層面咱們日常會使用new,delete,malloc,free方式來申請內存。而Linux內核會爲進程分配一段內存地址,隨着進程申請內存增長,進程會經過系統調用brk,讓內核來拓展這段內存空間;當進程釋放內存時,進程又經過系統調用brk,來告訴內核縮減這段內存,內核將其一部分物理地址進行回收。當程序調用內存申請接口(malloc)時,具體分配流程以下:

1.1. 小塊內存分配

對於堆段的內存分配,若是是小塊內存分配,爲了減小內存碎片,glibc庫對於某些相鄰的內存肯進行合併,可是爲了節省cpu和內存,對於太小的內存並不會進行合併,具體閾值能夠經過接口進行設置,以下接口:

![](https://img2018.cnblogs.com/blog/1285081/201809/1285081-20180915113555902-2007349573.png)

1.2. 大塊內存分配

若是是大塊內存分配,當申請內存數量大於一個閾值,glibc會採用mmaps爲進程分配一塊虛擬空間,而不是採用brk,來拓展棧頂指針。以下接口:

1.3. 內存釋放

至於內存釋放,當咱們調用free時,系統並不會當即將內存回收,而是將其cache,保留到下次使用。緣由是頻繁申請釋放會形成大量的系統調用,會影響進程效率。對於free後,是否系統回收,也能夠經過接口設置。以下接口:

![](https://img2018.cnblogs.com/blog/1285081/201809/1285081-20180915114430173-29012923.png)

1.4. 內存空洞

還有一個概念咱們須要知道,就是內存空洞,就是一段內存,中間的釋放了,可是堆頂沒用釋放,致使全部的內存沒法被系統回收。 對於內存空洞,見下面這段文字描述:

注:如何區份內存空洞和內存泄漏

從上面描述知道,對於內存空洞,咱們只需瞭解便可,按照就近原則釋放便可。固然對於內存空洞,實際上是有另外的內存管理機制能夠解決的,若是感興趣,能夠另外瞭解一下。

2. 棧段

用於維護函數調用的上下文空間,通常爲 8M ,可經過 ulimit –s 查看(函數堆棧打印就是基於此實現) 。 那在使用的過程當中,咱們需注意,1. 儘可能避免在棧空間申請大量內存;2. 儘可能避免遞歸使用

3. 數據段

也就是咱們進程空間中的.bss和.data,主要用來保存全局變量、靜態變量,二者區別:

![](https://img2018.cnblogs.com/blog/1285081/201809/1285081-20180915120742097-1386287251.png)

4. 代碼段

代碼段是整個系統共享的,位於進程只讀段。

5. 共享映射

咱們看進程的空間結構圖能夠知道,還有一個文件映射區域,這裏只要是動態庫、共享內存等映射物理空間的內存,通常是 mmap 函數所分配的虛擬地址空間。

四. 總結

文章中出現的圖片和相關文字描述截圖主要出自書籍< <深刻理解計算機系統> >, < <嵌入式linux性能詳解> > ,兩本書都很是不錯!

文章主要是對內存作了一個總體介紹,自底向上,從系統層面,進程層面,到用戶代碼層面,進行了詳細的分析和總結,使得咱們對Linux內存管理有了一個系統的認識!

2018年9月15日12:33:02

相關文章
相關標籤/搜索