一 進程空間分佈概述linux
程序段(Text):程序代碼在內存中的映射,存放函數體的二進制代碼。程序員
初始化過的數據(Data):在程序運行初已經對變量進行初始化的數據。算法
未初始化過的數據(BSS):在程序運行初未對變量進行初始化的數據。編程
棧 (Stack):存儲局部、臨時變量,函數調用時,存儲函數的返回指針,用於控制函數的調用和返回。在程序塊開始時自動分配內存,結束時自動釋放內存,其操做方式相似於數據結構中的棧。安全
堆 (Heap):存儲動態內存分配,須要程序員手工分配,手工釋放.注意它與數據結構中的堆是兩回事,分配方式相似於鏈表。數據結構
Linux使用兩級保護機制:0級供內核使用,3級供用戶程序使用,每一個進程有各自的私有用戶空間(0~3G),這個空間對系統中的其餘進程是不可見的,最高的1GB字節虛擬內核空間則爲全部進程以及內核所共享。
內核空間中存放的是內核代碼和數據,而進程的用戶空間中存放的是用戶程序的代碼和數據。不論是內核空間仍是用戶空間,它們都處於虛擬空間中。 雖然內核空間佔據了每一個虛擬空間中的最高1GB字節,但映射到物理內存卻老是從最低地址(0x00000000),另外,使用虛擬地址能夠很好的保護內核空間被用戶空間破壞,虛擬地址到物理地址轉換過程有操做系統和CPU共同完成(操做系統爲CPU設置好頁表,CPU經過MMU單元進行地址轉換)。多線程
上圖中藍色區域表示映射到物理內存的虛擬地址,而白色區域表示未映射的部分。能夠看出,Firefox使用了至關多的虛擬地址空間,由於它佔用內存較多。app
進程地址空間中最頂部的段是棧,大多數編程語言將之用於存儲函數參數和局部變量。調用一個方法或函數會將一個新的棧幀(stack frame)壓入到棧中,這個棧幀會在函數返回時被清理掉。因爲棧中數據嚴格的遵照FIFO的順序,這個簡單的設計意味着沒必要使用複雜的數據結構來追蹤棧中的內容,只須要一個簡單的指針指向棧的頂端便可,所以壓棧(pushing)和退棧(popping)過程很是迅速、準確。進程中的每個線程都有屬於本身的棧。編程語言
經過不斷向棧中壓入數據,超出其容量就會耗盡棧所對應的內存區域,這將觸發一個頁故障(page fault),而被Linux的expand_stack()處理,它會調用acct_stack_growth()來檢查是否還有合適的地方用於棧的增加。若是棧的大小低於RLIMIT_STACK(一般爲8MB),那麼通常狀況下棧會被加長,程序繼續執行,感受不到發生了什麼事情。這是一種將棧擴展到所需大小的常規機制。然而,若是達到了最大棧空間的大小,就會棧溢出(stack overflow),程序收到一個段錯誤(segmentation fault)。函數
你能夠經過閱讀文件/proc/pid_of_process/maps來檢驗一個Linux進程中的內存區域。記住:一個段可能包含許多區域。好比,每一個內存映射文件在mmap段中都有屬於本身的區域,動態庫擁有相似BSS和數據段的額外區域。有時人們提到「數據段」,指的是所有的數據段+BSS+堆。
你還能夠經過nm和objdump命令來察看二進制鏡像,打印其中的符號,它們的地址,段等信息。最後須要指出的是,前文描述的虛擬地址佈局在linux中是一種「靈活佈局」,並且做爲默認方式已經有些年頭了,它假設咱們有值RLIMT_STACK。可是,當沒有該值得限制時,Linux退回到「經典佈局」,以下圖所示:
以前一直在分析棧,棧這個東西的做用也介紹得差很少了,可是棧在哪兒尚未搞清楚,以及堆、代碼、全局變量它們在哪兒,這都牽涉到進程的內存分佈。
內存分佈隨着操做系統的更新換代,愈來愈科學合理,也愈來愈複雜,因此咱們仍是先了解一下早期操做系統的典型 linux 0.01 的進程的內存分佈:
linux 0.01 的一個進程固定擁有64MB的線性內存空間(ACM競賽中單個程序的最大內存佔用限制爲64MB,這確定有貓膩O(∩_∩)O~),各個進程挨個放置在一張頁目錄表中,一個頁目錄表可管理4G的線性空間,所以 linux0.01 最多有 64個進程。每一個進程的內存分佈以下:
.text .rodata .data .bss 是常駐內存的,也就是說進程從開始運行到進程僵死它們一直蹲在那裏,因此訪問它們用的是常量地址;而棧是不斷的加幀(函數調用)、減幀(函數返回)的,幀內的局部變量只能用相對於當前 esp(指向棧頂)或 ebp(指向當前幀)的相對地址來訪問。
棧被放置在高地址也是有緣由的: 調用函數(加幀)是減 esp 的,函數返回(減幀)是加 esp 的,調用在前,因此棧是向低地址擴展的,放在高地址再合適不過了。
認識了 linux 0.01 的內存分佈後,再看看現代操做系統的內存分佈發生了什麼變化:
首先,linux 0.01 進程的64MB內存限制太過期了,如今的程序都有潛力使用到 2GB、3GB 的內存空間(每一個進程一張頁目錄表),固然,機器有硬傷的話也沒辦法,個人電腦就只有 2GB 的內存,想用 3GB 的內存是沒期望了。但也不是有4GB內存就能夠用4GB(32位),由於操做系統還要佔個坑呢!現代 linux 中 0xC0000000 以上的 1GB 空間是操做系統專用的,而 linux 0.01 中第1個 64MB 是操做系統的坑,因此別的進程徹底佔有它們的 64MB,也不用跟操做系統客氣。
其次,linux 0.01只有進程沒有線程,可是現代 linux 有多線程了(linux 的線程實際上是個輕量級的進程),一個進程的多個線程之間共享全局變量、堆、打開的文件…… 但棧是不能共享的:棧中各層函數幀表明着一條執行線索,一個線程是一條執行線索,因此每一個線程獨佔一個棧,而這些棧又都必須在所屬進程的內存空間中。
根據以上兩點,進程的內存分佈就變成了下面這個樣子:
再者,若是把動態裝載的動態連接庫也考慮進去的話,上面的分佈圖將會更加"破碎"。
若是咱們的程序沒有采用多線程的話,通常能夠簡單地認爲它的內存分佈模型是 linux 0.01 的那種。