C++ 編譯過程
在介紹編譯器以前,先簡單地說一下 C++ 的編譯過程,以便理解編譯器的工做。
編譯(compiling)並不意味着只建立僅僅一個可執行文件。建立一個可執行文件是一個多級過程,其中最重要的過程是預處理(preprocessing),編譯(compliation)和連接(linking)。從源代碼文件到一個可執行文件的整個過程,最好的說法是 build(中文翻譯的話,有叫生成,有叫編譯連接,也有叫構建)。compiling 僅僅是 build 過程的一部分,但你常常會碰到許多人把 compile 指代整個過程。一般狀況下,你不須要爲這幾個過程運行單獨的命令,編譯器本身會調用,如預處理器。ios
2.1 預處理
build 過程的第一步就是編譯器運行 C 預處理器,目的是對代碼文件進行文本上的處理。它會處理頭文件包含指令(#include),條件編譯指令(#ifdef……#endif)和宏(#define),這些指令叫作預處理指令,都以井字符 # 開頭。編譯器自己是絕對看不到這些預處理指令的。
好比:函數
#include <iostream>
這句代碼會告訴預處理指令,要把 iostream 的文件內容抓去到當前文件,你每包含一個頭文件,它就會把這個頭文件的內容粘貼到這個文件中,而後把 #include 指令移除。測試
#define MY_NAME "Alex"
宏就是一個被其它內容(可能比較複雜)替換掉的字符串內容,此時預處理器會把下面的代碼:ui
cout << "Hello" << MY_NAME << endl;
展開成:spa
cout << "Hello" << "Alex" << endl;
因爲預處理器在編譯器以前處理代碼,它也能夠用來移除代碼——有時,你會要在代碼裏執行某些測試代碼。你能夠告訴預處理器,若是定義了某個宏,則包含某些代碼。而後,若是你想執行這個代碼,就定義這個宏,不然就移除掉這個宏的定義。翻譯
#include <iostream> #define DEBUG using namespace std; int main() { int x; int y; cout << "Enter value for x: "; cin >> x; cout << "Enter value for y: "; cin >> y; x *= y; #ifdef DEBUG cout << "x: " << x << '\n' << "y: "<< y; #endif }
若是你不想執行變量的打印,那麼只需簡單註釋掉 #define DEBUG 就行。
一樣地,你也能夠用 #ifndef 來改變條件——若是沒有定義……這個方法一般用在引入多個頭文件的時候。code
2.2 編譯
編譯意味着把一個源文件(.cpp)轉變成一個對象文件(object,.o 或 .obj)。
一個對象文件會把你程序裏的每個函數,封裝成一個計算機處理器能理解的形式——機器指令(machine language instructions)。每個源文件都是單獨編譯過的,即對象文件包含的機器代碼都是編譯過的源代碼。好比,你有三個源文件,通過編譯,生成了三個對象文件,每個對象文件都包含了各自對應的機器代碼。
但你還不能運行它們,這時候,就須要連接器了。對象
2.3 連接
連接(Linking),是把一堆對象文件和庫(有時也可能僅僅是一個對象文件,但也須要連接)建立成一個單獨的可執行文件(好比 .exe 或 .dll)。
連接器經過一種適當的格式建立一個可執行的文件,並傳遞每一個獨立的對象文件內容到一個可執行的結果。連接器也處理含有對象文件源代碼以外的其它函數的引用,好比 C++ 標準庫裏的函數。當你調用了一個 C++ 標準庫的函數,如 cout << 「Hi」,你就在使用一個本身代碼中沒有定義的函數,它被定義在一個相關的對象文件中,但這是由編譯器提供的,並不屬於你。在編譯時,編譯器知道這個函數是有效的,由於你引出了 iostream 頭文件,但因爲這個函數不是 cpp 文件的一部分,編譯器就會在調用樹(call tree)留下一個存根(stub),連接器會遍歷對象文件,針對每個存根,它會找到正確的函數地址,而後從已連接過的其它對象文件中,用正確的地址替換掉對應的存根。
這個過程有時也叫作修正(fixup)。當你把你的程序分離成多個源文件時,你就會利用連接器來修正全部在源文件中調用過的函數。若是連接器找不到這個函數的位置,它就會生成一個 undefined function error,即使代碼被編譯器經過了,也不意味着代碼是正確的。連接器是首先以全局的視角來探測這種錯誤的。blog