gcc/g++等編譯器 編譯原理: 預處理,編譯,彙編,連接各步驟詳解

摘自http://blog.csdn.net/elfprincexu/article/details/45043971小程序

gcc/g++等編譯器 編譯原理: 預處理,編譯,彙編,連接各步驟詳解ide

C和C++編譯器是集成的,編譯通常分爲四個步驟:函數

  1. 預處理(preprocessing)  ----------------- cpp/ gcc -E 
  2. 編譯(compilation) ------------------ cc1 / gcc -S
  3. 彙編(assembly)  -------------------- as
  4. 鏈接(linking) --------------------- ld 
 
 

 

gcc工具

  認爲預處理的文件是(.i)是C文件,而且設定C形式的鏈接;spa

g++.net

  認爲預處理的文件是(.i)是C++文件,而且設定C++形式的鏈接;命令行

 

源文件後綴名的一些含義和後續的操做:翻譯

  • .c       C源程序        預處理,編譯,彙編
  • .C      C++源程序        預處理,編譯,彙編
  • .cc       C++源程序  
  • .cxx       C++源程序        預處理,編譯,彙編
  • .m       Objective-C源程序   預處理,編譯,彙編
  • .i       預處理後的C文件     編譯,彙編
  • .ii      預處理後的C++文件   編譯,彙編
  • .s      彙編語言源程序     彙編
  • .S      彙編語言源程序     預處理,彙編
  • .h      預處理器文件      一般不出如今命令行上  

 

其餘後綴名的文件被傳遞給鏈接器(linker).一般包括:code


  .o 目標文件(Object file)blog


  .a 歸檔庫文件(Archive file)

 

轉載請註明出處: http://blog.csdn.net/elfprincexu

 

2、具體介紹一下GCC編譯步驟

首先,有如下hello.c源代碼

 

[cpp]  view plain  copy
 
 print?在CODE上查看代碼片派生到個人代碼片
  1. #include<stdio.h>  
  2.   
  3. int main()  
  4. {  
  5.       printf("Hello! This is our embedded world!\n");  
  6.   
  7.       return 0;  
  8. }  

 

(1)預處理階段

在該階段,編譯器將上述代碼中的stdio.h編譯進來,而且用戶可使用Gcc的選項」-E」進行查看,該選項的做用是讓Gcc在預處理結束後中止編譯過程。預處理階段主要處理#include和#define,它把#include包含進來的.h 文件插入到#include所在的位置,把源程序中使用到的用#define定義的宏用實際的字符串代替,咱們能夠用-E選項要求gcc只進行預處理而不進行後面的三個階段,


 注意 : Gcc指令的通常格式爲:Gcc [選項] 要編譯的文件 [選項] [目標文件]

 其中,目標文件可缺省,Gcc默認生成可執行的文件,命爲:編譯文件.out
 

[root@localhost Gcc]# Gcc –E hello.c –o hello.i

 

在此處,選項"-o"是指目標文件,".i"文件爲已通過預處理的C原始程序。如下列出了hello.i文件的部份內容:

 

[cpp]  view plain  copy
 
 print?在CODE上查看代碼片派生到個人代碼片
  1. typedef int (*__gconv_trans_fct) (struct __gconv_step *,  
  2.   
  3.          struct __gconv_step_data *, void *,  
  4.   
  5.          __const unsigned char *,  
  6.   
  7.          __const unsigned char **,  
  8.   
  9.          __const unsigned char *, unsigned char **,  
  10.   
  11.          size_t *);  
  12.   
  13. …  
  14.   
  15. # 2 "hello.c" 2  
  16.   
  17. int main()  
  18.   
  19. {  
  20.   
  21.  printf("Hello! This is our embedded world!\n");  
  22.   
  23.  return 0;  
  24.   
  25. }   

 

因而可知,Gcc確實進行了預處理,它把」stdio.h」的內容插入到hello.i文件中。

 

(2)編譯階段

接下來進行的是編譯階段,在這個階段中,Gcc首先要檢查代碼的規範性、是否有語法錯誤等,以肯定代碼的實際要作的工做,在檢查無誤後,Gcc把代碼翻譯成彙編語言。用戶可使用」-S」選項來進行查看,該選項只進行編譯而不進行彙編,生成彙編代碼。

 

編譯階段是最重要的階段,在這個階段GCC首先檢查語法而後把由上步生成的*.i編譯成*.s文件。咱們能夠用以下命令告訴gcc進行這一步處理,gcc -S hello.i -o hello.s,-S選項告訴gcc把hello.i編譯成.s文件;

上面這兩步的輸出文件都是文本文件,咱們能夠用諸如cat的文本處理等命令閱讀這些輸出文件。
這個階段能夠接收.c和.i類型的文件
 

[root@localhost Gcc]# Gcc –S hello.i –o hello.s

 

如下列出了hello.s的內容,可見Gcc已經將其轉化爲彙編了,感興趣的讀者能夠分析一下這一行簡單的C語言小程序是如何用匯編代碼實現的。

 

[cpp]  view plain  copy
 
 print?在CODE上查看代碼片派生到個人代碼片
  1.  .file   "hello.c"  
  2.   
  3.      .section    .rodata  
  4.   
  5.      .align 4  
  6.   
  7. .LC0:  
  8.   
  9.      .string     "Hello! This is our embedded world!"  
  10.   
  11.      .text  
  12.   
  13. .globl main  
  14.   
  15.      .type main, @function  
  16.   
  17. main:  
  18.   
  19.      pushl %ebp  
  20.   
  21.      movl %esp, %ebp  
  22.   
  23.      subl $8, %esp  
  24.   
  25.      andl $-16, %esp  
  26.   
  27.      movl $0, %eax  
  28.   
  29.      addl $15, %eax  
  30.   
  31.      addl $15, %eax  
  32.   
  33.      shrl $4, %eax  
  34.   
  35.      sall $4, %eax  
  36.   
  37.      subl %eax, %esp  
  38.   
  39.      subl $12, %esp  
  40.   
  41.      pushl $.LC0  
  42.   
  43.      call puts  
  44.   
  45.      addl $16, %esp  
  46.   
  47.      movl $0, %eax  
  48.   
  49.      leave  
  50.   
  51.      ret  
  52.   
  53.      .size   main, .-main  
  54.   
  55.      .ident  "GCC: (GNU) 4.0.0 20050519 (Red Hat 4.0.0-8)"  
  56.   
  57.      .section    .note.GNU-stack,"",@progbits  
  58.   
  59.    

 


(3)彙編階段

 

 

彙編階段把*.s文件翻譯成二進制機器指令文件*.o,如命令gcc -c hello.s -o hello.o,其中-c告訴gcc進行彙編處理。這步生成的文件是二進制文件,直接用文本工具打開看到的將是亂碼,咱們須要反彙編工具如GDB的幫助才能讀懂它;
這個階段接收.c, .i, .s的文件都沒有問題。好比gcc -c hello.i -o hello.o等

 

彙編階段是把編譯階段生成的」.s」文件轉成目標文件,讀者在此可以使用選項」-c」就可看到彙編代碼已轉化爲」.o」的二進制目標代碼了。以下所示: 

[root@localhost Gcc]# Gcc –c hello.s –o hello.o

 

(4)連接階段

在成功編譯以後,就進入了連接階段。在這裏涉及到一個重要的概念:函數庫。

讀者能夠從新查看這個小程序,在這個程序中並無定義」printf」的函數實現,且在預編譯中包含進的」stdio.h」中也只有該函數的聲明,而沒有定義函數的實現,那麼,是在哪裏實現」printf」函數的呢?最後的答案是:系統把這些函數實現都被作到名爲libc.so.6的庫文件中去了,在沒有特別指定時,Gcc會到系統默認的搜索路徑」/usr/lib」下進行查找,也就是連接到libc.so.6庫函數中去,這樣就能實現函數」printf」了,而這也就是連接的做用。

 

函數庫通常分爲靜態庫和動態庫兩種。

 

  • 靜態庫是指編譯連接時,把庫文件的代碼所有加入到可執行文件中,所以生成的文件比較大,但在運行時也就再也不須要庫文件了。其後綴名通常爲」.a」。
  • 動態庫與之相反,在編譯連接時並無把庫文件的代碼加入到可執行文件中,而是在程序執行時由運行時連接文件加載庫,這樣能夠節省系統的開銷。動態庫通常後綴名爲」.so」,如前面所述的libc.so.6就是動態庫。Gcc在編譯時默認使用動態庫。

 

 

[cpp]  view plain  copy
 
 print?在CODE上查看代碼片派生到個人代碼片
  1. 說下生成靜態庫的方法:  
  2.     ar cr libxxx.a file1.o file2.o  
  3. 就是把file1.o和file2.o打包生成libxxx.a靜態庫  
  4. 使用的時候  
  5.     gcc test.c -L/path -lxxx -o test  
  6.   
  7. 動態庫的話:  
  8.     gcc -fPIC -shared file1.c -o libxxx.so  
  9. 也能夠分紅兩部來寫:  
  10.     gcc -fPIC file1.c -c //這一步生成file1.o  
  11.     gcc -shared file1.o -o libtest.so  
 
效果是同樣的。
用的時候和上面的靜態庫的用法同樣
可是到了運行程序的時候,須要指定動態庫的位置,能夠環境變量來指定
export LD_LIBRARY_PATH=path,不然會提示找不到動態庫的位置
 
因爲連接動態庫和靜態庫的時候使用的方法是同樣的,因此若是在庫中有同名的靜態庫文件和動態庫文件,好比libtest.a和libtest.so,根據gcc連接時默認優先選擇動態庫,會連接libtest.so,若是想要讓gcc選擇連接libtest.a那麼須要指定一個選項,就是-static,這樣就會強制gcc找靜態庫文件了。

 

靜態庫連接時搜索路徑順序:

 

  • 1. ld會去找GCC命令中的參數-L
  • 2. 再找gcc的環境變量LIBRARY_PATH
  • 3. 再找內定目錄 /lib /usr/lib /usr/local/lib 這是當初compile gcc時寫在程序內的

 

動態連接時、執行時搜索路徑順序:

 

  • 1. 編譯目標代碼時指定的動態庫搜索路徑
  • 2. 環境變量LD_LIBRARY_PATH指定的動態庫搜索路徑
  • 3. 配置文件/etc/ld.so.conf中指定的動態庫搜索路徑
  • 4. 默認的動態庫搜索路徑/lib
  • 5. 默認的動態庫搜索路徑/usr/lib

 

 

有關環境變量:

  • LIBRARY_PATH環境變量:指定程序靜態連接庫文件搜索路徑
  • LD_LIBRARY_PATH環境變量:指定程序動態連接庫文件搜索路徑

 


完成了連接以後,Gcc就能夠生成可執行文件,以下所示。

[root@localhost Gcc]# Gcc hello.o –o hello

 

運行該可執行文件,出現正確的結果以下。 

[root@localhost Gcc]# ./hello

Hello! This is our embedded world!

相關文章
相關標籤/搜索