C++編譯過程與內存空間



爲何須要知道C/C++的內存佈局和在哪能夠能夠找到想要的數據?知道內存佈局對調試程序很是有幫助,能夠知道程序執行時,到底作了什麼,有助於寫出乾淨的代碼。本文的主要內容以下:html

  • 源文件轉換爲可執行文件
  • 可執行程序組成及內存佈局
  • 數據存儲類別
  • 一個實例
  • 總結

  源文件轉換爲可執行文件

源文件通過如下幾步生成可執行文件:安全

  • 一、預處理(preprocessor):對#include、#define、#ifdef/#endif、#ifndef/#endif等進行處理
  • 二、編譯(compiler):將源碼編譯爲彙編代碼
  • 三、彙編(assembler):將彙編代碼彙編爲目標代碼
  • 四、連接(linker):將目標代碼連接爲可執行文件

編譯器和彙編器建立的目標文件包含:二進制代碼(指令)、源碼中的數據;連接器將多個目標文件連接成一個;裝載器吧目標文件加載到內存。ide

圖1 源文件到可執行文件的步驟函數

 

  可執行程序組成及內存佈局

經過上面的小節,咱們知道將源程序轉換爲可執行程序的步驟,典型的可執行文件分爲兩部分:佈局

  • 代碼段(Code),由機器指令組成,該部分是不可改的,編譯以後就再也不改變,放置在文本段(.text)。
  • 數據段(Data),它由如下幾部分組:
    • 常量(constant),一般放置在只讀read-only的文本段(.text
    • 靜態數據(static data),初始化的放置在數據段(.data);未初始化的放置在(.bss,Block Started by Symbol,BSS段的變量只有名稱和大小卻沒有值)
    • 動態數據(dynamic data),這些數據存儲在堆(heap)或棧(stack

源程序編譯後連接到一個以0地址爲始地址的線性或多維虛擬地址空間。並且每一個進程都擁有這樣一個空間,每一個指令和數據都在這個虛擬地址空間擁有肯定的地址,把這個地址稱爲虛擬地址(Virtual Address)。將進程中的目標代碼、數據等的虛擬地址組成的虛擬空間稱爲虛擬存儲器(Virtual Memory)。典型的虛擬存儲器中有相似的佈局:spa

  • Text Segment (.text)
  • Initialized Data Segment (.data)
  • Uninitialized Data Segment (.bss)
  • The Stack
  • The Heap

圖2 進程內存佈局操作系統

當進程被建立時,內核爲其提供一塊物理內存,將虛擬內存映射到物理內存,這些都是由操做系統來作的。.net

  數據存儲類別

討論C/C++中的內存佈局,不得不提的是數據的存儲類別!數據在內存中的位置取決於它的存儲類別。一個對象是內存的一個位置,解析這個對象依賴於兩個屬性:存儲類別、數據類型。線程

  • 存儲類別決定對象在內存中的生命週期。
  • 數據類型決定對象值的意義,在內存中佔多大空間。

C/C++中由(auto、 extern、 register、 static)存儲類別和對象聲明的上下文決定它的存儲類別。3d

  一、自動對象(automatic objects)

autoregister將聲明的對象指定爲自動存儲類別。他們的做用域是局部的,諸如一個函數內,一個代碼塊{***}內等。操做了做用域,對象會被銷燬。

  • 在一個代碼塊中聲明一個對象,若是沒有執行auto,那麼默認是自動存儲類別。
  • 聲明爲register的對象是自動存儲類別,存儲在計算機的快速寄存器中。不能夠對register對象作取值操做「&」。

  二、靜態對象(static objects)

靜態對象能夠局部的,也能夠是全局的。靜態對象一直保持它的值,例如進入一個函數,函數中的靜態對象仍保持上次調用時的值。包含靜態對象的函數不是線程安全的、不可重入的,正是由於它具備「記憶」功能。

  • 局部對象聲明爲靜態以後,將改變它在內存中保存的位置,由動態數據--->靜態數據,即從堆或棧變爲數據段或bbs段。
  • 全局對象聲明爲靜態以後,而不會改變它在內存中保存的位置,仍然是在數據段或bbs段。可是static將改變它的做用域,即該對象僅在本源文件有效。此相反的關鍵字是extern,使用extern修飾或者什麼都不帶的全局對象的做用域是整個程序。

 

  一個實例

下面咱們分析一段代碼:

 

  1. #include <stdio.h>  
  2. #include <stdlib.h>  
  3.    
  4. int a;  
  5. static int b;  
  6. void func(void)  
  7. {  
  8.     charc;  
  9.     static int d;  
  10. }  
  11. int main(void)  
  12. {  
  13.     int e;  
  14.     int*pi = ( int*)malloc(sizeof(int));  
  15.     func ();  
  16.     func ();  
  17.     free(pi );  
  18.     return(0);  
  19. }  


 

?

程序中聲明的變量a、b、c、d、e、pi的存儲類別和生命期以下所述:

  • a是一個未初始化的全局變量,做用域爲整個程序,生命期是整個程序運行期間,在內存的bbs段
  • b是一個未初始化的靜態全局變量,做用域爲本源文件,生命期是整個程序運行期間,在內存的bbs段
  • c是一個未初始化的局部變量,做用域爲函數func體內,即僅在函數體內可見,生命期也是函數體內,在內存的棧中
  • d是一個未初始化的靜態局部變量,做用域爲函數func體內,即僅在函數體內可見,生命期是整個程序運行期間,在內存的bbs段
  • e是一個未初始化的局部變量,做用域爲函數main體內,即僅在函數體內可見,生命期是main函數內,在內存的棧中
  • pi是一個局部指針,指向堆中的一塊內存塊,該塊的大小爲sizeof(int),pi自己存儲在內存的棧中,生命期是main函數內
  • 新申請的內存塊在堆中,生命期是malloc/free之間

用圖表示以下:

圖3 例子的內存佈局

 

  總結

本文介紹了C/C++中由源程序到可執行文件的步驟,和可執行程序的內存佈局,數據存儲類別,最後還經過一個例子來講明。可執行程序中的變量在內存中的佈局能夠總結爲以下:

  • 變量(函數外):若是未初始化,則存放在BSS段;不然存放在data段
  • 變量(函數內):若是沒有指定static修飾符,則存放在棧中;不然同上
  • 常量:存放在文本段.text
  • 函數參數:存放在棧或寄存器中

內存能夠分爲如下幾段:

  • 文本段:包含實際要執行的代碼(機器指令)和常量。它一般是共享的,多個實例之間共享文本段。文本段是不可修改的。
  • 初始化數據段:包含程序已經初始化的全局變量,.data。
  • 未初始化數據段:包含程序未初始化的全局變量,.bbs。該段中的變量在執行以前初始化爲0或NULL。
  • 棧:由系統管理,由高地址向低地址擴展。
  • 堆:動態內存,由用戶管理。經過malloc/alloc/realloc、new/new[]申請空間,經過free、delete/delete[]釋放所申請的
  • 空間。由低地址想高地址擴展


相關文章
相關標籤/搜索