Linux C程序的連接 與 未用代碼

寫代碼的過程不免會出現存在未用代碼的狀況 (通常是未用到的函數)
尤爲在基礎組件的編碼過程當中(有些函數不會被調用)
如何讓生成的二進制可執行文件不包含冗餘信息呢?

狀況是這樣的,有一個基礎組件,有六組函數,文件就一個 xxx.h 和 xxx.c
而後編譯成 xxx.o   (gcc -c xxx.c

(37K 的 xxx.o)
函數

而後主程序用到其中的一組函數,因而須要include xxx.h
而且連接時須要連接到xxx.o     (gcc -o main main.c xxx.o 編譯連接一塊兒了)

(44K 的 main,實際只用了組件的很小一部分)
工具

後來發現main程序(二進制可執行文件)特別大,由於這個程序包含了所有六組的函數的代碼
可使用nm命令來查看 能夠清楚的看到所有函數都被連接進去了
(nm用來列出目標文件的符號清單)

(箭頭指向的纔是使了的函數,這個圖有誤,但無關痛癢)

原來gcc會直接連接整個部分而無論你使用與否
使用 readelf查看生成的 xxx.o文件裏面的 section(段)信息

所有函數和數據之類都是放到一個段(section)的

而連接操做以section做爲最小的處理單元,只要一個section中有某個符號被引用,該section就會被放入output中。因而所有代碼都被編譯到了main中。

怎樣解決這個問題呢?查閱了gcc的文檔後
發現有兩個參數可使用
一個是 -ffunction-sections (爲每一個function函數分配獨立的section)
另外一個是 -fdata-sections (爲每一個data item數據項分配獨立的section)

如今使用 gcc -c -ffunction-sections -fdata-sections xxx.c 編譯

(xxx.o的文件尺寸明顯變大了,由於段多了)

性能

此時再查看 section信息

段已經多得顯示不全了(除了接口函數外,還有一系列內部函數)

而後連接的時候使用 -Wl,--gc-sections
-Wl,的意思是將後面的內容傳遞給連接器
--gc-sections是連接器參數,不連接未使用的section

如今使用 gcc -Wl,--gc-sections -o main main.c xxx.o 來編譯&連接
編碼


如今main的大小已經明顯變小了(44K -> 18K)

再用 nm命令查看

原來的符號表已經少了不少了(清除了無用的)

既然能夠這樣,爲啥默認不採用這種方式呢?
有人說每一個函數分個段,程序執行的時候段間跳轉,多慢啊
應該不會的,可使用readelf讀取main的信息

能夠清楚的看到並無不少的(冗餘)段,代碼主體仍是在一塊兒的

至於這個參數, gcc的 官方文檔以下

大概意思就是:在目標文件中每一個函數、數據項使用獨立的段,段名由函數、數據項名決定。使用這個選項能夠提升指令空間的利用率。大多數使用ELF目標文件格式和SPARC處理器運行Solaris2有連接器支持它。AIX未來可能支持。當你使用這個時,彙編器和連接器會產生更大的目標文件,而且處理得更慢。你也不能使用gprof(一個性能分析工具)在你用了這個選項後,並且若是同時用了-g選項,調試的時候可能會產生問題。

官方文檔就只說明瞭這些,至於有沒有其餘的潛在問題,還得看gcc實現了吧。

在 Release版本中,使用這個仍是有明顯的好處的。 spa

相關文章
相關標籤/搜索