交叉編譯器 arm-linux-gnueabi 和 arm-linux-gnueabihf 的區別

本身以前一直沒搞清楚這兩個交叉編譯器到底有什麼問題,特地google一番,總結以下,但願能幫到道上和我有一樣困惑的兄弟…..linux

一. 什麼是ABI和EABI
1) ABI: 二進制應用程序接口(Application Binary Interface (ABI) for the ARM Architecture)
在計算機中，應用二進制接口描述了應用程序（或者其餘類型）和操做系統之間或其餘應用程序的低級接口.
ABI涵蓋了各類細節，如：
數據類型的大小、佈局和對齊;
調用約定（控制着函數的參數如何傳送以及如何接受返回值），例如，是全部的參數都經過棧傳遞，仍是部分參數經過寄存器傳遞；哪一個寄存器用於哪一個函數參數；經過棧傳遞的第一個函數參數是最早push到棧上仍是最後；
系統調用的編碼和一個應用如何向操做系統進行系統調用；
以及在一個完整的操做系統ABI中，目標文件的二進制格式、程序庫等等。
一個完整的ABI，像Intel二進制兼容標準 (iBCS) ，容許支持它的操做系統上的程序不經修改在其餘支持此ABI的操做體統上運行。
ABI不一樣於應用程序接口（API），API定義了源代碼和庫之間的接口，所以一樣的代碼能夠在支持這個API的任何系統中編譯，ABI容許編譯好的目標代碼在使用兼容ABI的系統中無需改動就能運行。架構

2) EABI: 嵌入式ABI
嵌入式應用二進制接口指定了文件格式、數據類型、寄存器使用、堆積組織優化和在一個嵌入式軟件中的參數的標準約定。
開發者使用本身的彙編語言也可使用EABI做爲與兼容的編譯器生成的彙編語言的接口。
支持EABI的編譯器建立的目標文件能夠和使用相似編譯器產生的代碼兼容，這樣容許開發者連接一個由不一樣編譯器產生的庫。
EABI與關於通用計算機的ABI的主要區別是應用程序代碼中容許使用特權指令，不須要動態連接（有時是禁止的），和更緊湊的堆棧幀組織用來節省內存。普遍使用EABI的有Power PC和ARM.函數

二. gnueabi相關的兩個交叉編譯器: gnueabi和gnueabihf
在debian源裏這兩個交叉編譯器的定義以下:
gcc-arm-linux-gnueabi – The GNU C compiler for armel architecture
gcc-arm-linux-gnueabihf – The GNU C compiler for armhf architecture
可見這兩個交叉編譯器適用於armel和armhf兩個不一樣的架構, armel和armhf這兩種架構在對待浮點運算採起了不一樣的策略(有fpu的arm才能支持這兩種浮點運算策略)工具

其實這兩個交叉編譯器只不過是gcc的選項-mfloat-abi的默認值不一樣. gcc的選項-mfloat-abi有三種值soft,softfp,hard(其中後二者都要求arm裏有fpu浮點運算單元,soft與後二者是兼容的，但softfp和hard兩種模式互不兼容)：
soft : 不用fpu進行浮點計算，即便有fpu浮點運算單元也不用,而是使用軟件模式。
softfp : armel架構(對應的編譯器爲gcc-arm-linux-gnueabi)採用的默認值，用fpu計算，可是傳參數用普通寄存器傳，這樣中斷的時候，只須要保存普通寄存器，中斷負荷小，可是參數須要轉換成浮點的再計算。
hard : armhf架構(對應的編譯器gcc-arm-linux-gnueabihf)採用的默認值，用fpu計算，傳參數也用fpu中的浮點寄存器傳，省去了轉換, 性能最好，可是中斷負荷高。佈局

把如下測試使用的c文件內容保存成mfloat.c：
#include <stdio.h>
int main(void)
{
double a,b,c;
a = 23.543;
b = 323.234;
c = b/a;
printf(「the 13/2 = %f\n」, c);
printf(「hello world !\n」);
return 0;
}性能

1)使用arm-linux-gnueabihf-gcc編譯，使用「-v」選項以獲取更詳細的信息:
# arm-linux-gnueabihf-gcc -v mfloat.c
COLLECT_GCC_OPTIONS=’-v’ ‘-march=armv7-a’ ‘-mfloat-abi=hard’ ‘-mfpu=vfpv3-d16′ ‘-mthumb’
-mfloat-abi=hard，可看出使用hard硬件浮點模式。測試

2)使用arm-linux-gnueabi-gcc編譯:
# arm-linux-gnueabi-gcc -v mfloat.c
COLLECT_GCC_OPTIONS=’-v’ ‘-march=armv7-a’ ‘-mfloat-abi=softfp’ ‘-mfpu=vfpv3-d16′ ‘-mthumb’
-mfloat-abi=softfp，可看出使用softfp模式。優化

三. 拓展閱讀
下文闡述了ARM代碼編譯時的軟浮點(soft-float)和硬浮點(hard-float)的編譯以及連接實現時的不一樣。從VFP浮點單元的引入到軟浮點(soft-float)和硬浮點(hard-float)的概念google

VFP (vector floating-point)
從ARMv5開始，就有可選的 Vector Floating Point (VFP) 模塊，固然最新的如 Cortex-A8, Cortex-A9 和 Cortex-A5 能夠配置成不帶VFP的模式供芯片廠商選擇。
VFP通過若干年的發展，有VFPv2 (一些 ARM9 / ARM11)、 VFPv3-D16（只使用16個浮點寄存器，默認爲32個）和VFPv3+NEON (如大多數的Cortex-A8芯片) 。對於包含NEON的ARM芯片，NEON通常和VFP公用寄存器。編碼

硬浮點Hard-float
編譯器將代碼直接編譯成發射給硬件浮點協處理器（浮點運算單元FPU）去執行。FPU一般有一套額外的寄存器來完成浮點參數傳遞和運算。
使用實際的硬件浮點運算單元FPU固然會帶來性能的提高。由於每每一個浮點的函數調用須要幾個或者幾十個時鐘週期。

軟浮點 Soft-float
編譯器把浮點運算轉換成浮點運算的函數調用和庫函數調用，沒有FPU的指令調用，也沒有浮點寄存器的參數傳遞。浮點參數的傳遞也是經過ARM寄存器或者堆棧完成。
如今的Linux系統默認編譯選擇使用hard-float，即便系統沒有任何浮點處理器單元，這就會產生非法指令和異常。於是通常的系統鏡像都採用軟浮點以兼容沒有VFP的處理器。

armel ABI和armhf ABI
在armel中，關於浮點數計算的約定有三種。以gcc爲例，對應的-mfloat-abi參數值有三個：soft,softfp,hard。
soft是指全部浮點運算所有在軟件層實現，效率固然不高，會存在沒必要要的浮點到整數、整數到浮點的轉換，只適合於早期沒有浮點計算單元的ARM處理器；
softfp是目前armel的默認設置，它將浮點計算交給FPU處理，但函數參數的傳遞使用通用的整型寄存器而不是FPU寄存器；
hard則使用FPU浮點寄存器將函數參數傳遞給FPU處理。
須要注意的是，在兼容性上，soft與後二者是兼容的，但softfp和hard兩種模式不兼容。
默認狀況下，armel使用softfp，所以將hard模式的armel單獨做爲一個abi，稱之爲armhf。
而使用hard模式，在每次浮點相關函數調用時，平均能節省20個CPU週期。對ARM這樣每一個週期都很重要的體系結構來講，這樣的提高無疑是巨大的。
在徹底不改變源碼和配置的狀況下，在一些應用程序上，使用armhf能獲得20%——25%的性能提高。對一些嚴重依賴於浮點運算的程序，更是能夠達到300%的性能提高。

Soft-float和hard-float的編譯選項
在CodeSourcery gcc的編譯參數上，使用-mfloat-abi=name來指定浮點運算處理方式。-mfpu=name來指定浮點協處理的類型。
可選類型如fpa，fpe2，fpe3，maverick，vfp，vfpv3，vfpv3-fp16，vfpv3-d16，vfpv3-d16-fp16，vfpv3xd，vfpv3xd-fp16，neon，neon-fp16，vfpv4，vfpv4-d16，fpv4-sp-d16，neon-vfpv4等。
使用-mfloat-abi=hard (等價於-mhard-float) -mfpu=vfp來選擇編譯成硬浮點。使用-mfloat-abi=softfp就能兼容帶VFP的硬件以及soft-float的軟件實現，運行時的鏈接器ld.so會在執行浮點運算時對於運算單元的選擇，
是直接的硬件調用仍是庫函數調用，是執行/lib仍是/lib/vfp下的libm。-mfloat-abi=soft （等價於-msoft-float）直接調用軟浮點實現庫。

在ARM RVCT工具鏈下，定義fpu模式：
–fpu softvfp
–fpu softvfp+vfpv2
–fpu softvfp+vfpv3
–fpu softvfp+vfpv_fp16
–fpu softvfp+vfpv_d16
–fpu softvfp+vfpv_d16_fp16.

定義浮點運算類型
–fpmode ieee_full : 全部單精度float和雙精度double的精度都要和IEEE標準一致，具體的模式能夠在運行時動態指定；
–fpmode ieee_fixed ：舍入到最接近的實現的IEEE標準，不帶不精確的異常；
–fpmode ieee_no_fenv ：舍入到最接近的實現的IEEE標準，不帶異常；
–fpmode std ：非規格數flush到0、舍入到最接近的實現的IEEE標準，不帶異常；
–fpmode fast ：更積極的優化，可能會有一點精度損失。