轉自:https://blog.csdn.net/hunanchenxingyu/article/details/47003279php
本文介紹了ARM代碼編譯時的軟浮點(soft-float)和硬浮點(hard-float)的編譯以及連接實現時的不一樣。從VFP浮點單元的引入到軟浮點(soft-float)和硬浮點(hard-float)的概念,而後是在GCC和ARMCC RVCT工具鏈下的具體編譯參數。html
從ARMv5開始,就有可選的 Vector Floating Point (VFP)模塊,固然最新的如 Cortex-A8, Cortex-A9 和 Cortex-A5 能夠配置成不帶VFP的模式供芯片廠商選擇。VFP通過若干年的發展,有VFPv2 (一些 ARM9 / ARM11)、 VFPv3-D16(只使用16個浮點寄存器,默認爲32個)和VFPv3+NEON (如大多數的Cortex-A8芯片)。對於包含NEON的ARM芯片,NEON通常和VFP公用寄存器。wordpress
編譯器將代碼直接編譯成發射給硬件浮點協處理器(浮點運算單元FPU)去執行。FPU一般有一套額外的寄存器來完成浮點參數傳遞和運算。使用實際的硬件浮點運算單元FPU固然會帶來性能的提高。由於每每一個浮點的函數調用須要幾個或者幾十個時鐘週期。函數
編譯器把浮點運算轉換成浮點運算的函數調用和庫函數調用,沒有FPU的指令調用,也沒有浮點寄存器的參數傳遞。浮點參數的傳遞也是經過ARM寄存器或者堆棧完成。 如今的Linux系統默認編譯選擇使用hard-float,即便系統沒有任何浮點處理器單元,這就會產生非法指令和異常。於是通常的系統鏡像都採用軟浮點以兼容沒有VFP的處理器。工具
armel和armhf ABI
在armel中,關於浮點數計算的約定有三種。以gcc爲例,對應的-mfloat-abi參數值有三個:soft,softfp,hard。soft是指全部浮點運算所有在軟件層實現,效率固然不高,會存在沒必要要的浮點到整數、整數到浮點的轉換,只適合於早期沒有浮點計算單元的ARM處理器;softfp是目前armel的默認設置,它將浮點計算交給FPU處理,但函數參數的傳遞使用通用的整型寄存器而不是FPU寄存器;hard則使用FPU浮點寄存器將函數參數傳遞給FPU處理。須要注意的是,在兼容性上,soft與後二者是兼容的,但softfp和hard兩種模式不兼容。默認狀況下,armel使用softfp,所以將hard模式的armel單獨做爲一個abi,稱之爲armhf。而使用hard模式,在每次浮點相關函數調用時,平均能節省20個CPU週期。對ARM這樣每一個週期都很重要的體系結構來講,這樣的提高無疑是巨大的。在徹底不改變源碼和配置的狀況下,在一些應用程序上,使用armhf能獲得20%——25%的性能提高。對一些嚴重依賴於浮點運算的程序,更是能夠達到300%的性能提高。性能
在CodeSourcery gcc的編譯參數上,使用-mfloat-abi=name來指定浮點運算處理方式。-mfpu=name來指定浮點協處理的類型。可選類型如fpa,fpe2,fpe3,maverick,vfp,vfpv3,vfpv3-fp16,vfpv3-d16,vfpv3-d16-fp16,vfpv3xd,vfpv3xd-fp16,neon,neon-fp16,vfpv4,vfpv4-d16,fpv4-sp-d16,neon-vfpv4等。使用-mfloat-abi=hard (等價於-mhard-float) -mfpu=vfp來選擇編譯成硬浮點。使用-mfloat-abi=softfp就能兼容帶VFP的硬件以及soft-float的軟件實現,運行時的鏈接器ld.so會在執行浮點運算時對於運算單元的選擇,是直接的硬件調用仍是庫函數調用,是執行/lib仍是/lib/vfp下的libm。-mfloat-abi=soft (等價於-msoft-float)直接調用軟浮點實現庫。優化
在ARM RVCT工具鏈下,定義fpu模式:spa
? --fpu softvfp
? --fpu softvfp+vfpv2
? --fpu softvfp+vfpv3
? --fpu softvfp+vfpv_fp16
? --fpu softvfp+vfpv_d16
? --fpu softvfp+vfpv_d16_fp16..net
定義浮點運算類型orm
--fpmode ieee_full :全部單精度float和雙精度double的精度都要和IEEE標準一致,具體的模式能夠在運行時動態指定;
--fpmode ieee_fixed:舍入到最接近的實現的IEEE標準,不帶不精確的異常;
--fpmode ieee_no_fenv:舍入到最接近的實現的IEEE標準,不帶異常;
--fpmode std:非規格數flush到0、舍入到最接近的實現的IEEE標準,不帶異常;
--fpmode fast:更積極的優化,可能會有一點精度損失。
一個浮點軟連接實現的彙編例子
IMPORT __softfp_cos
BL __softfp_cos
__aeabi_dadd 浮點double類型數據的加法,__aeabi_fdiv 單精度浮點除法。
Partial reference of SoC and supported ISAs
Manufacturer http://houh-1984.blog.163.com/ |
SoC |
architecture |
VFP |
SIMD |
Notes |
Freescale |
iMX5x |
armv7 |
|||
Nvidia |
Tegra2 |
armv7 |
none |
||
Marvell |
Dove |
armv7 |
iwMMXt |
||
OMAP3xxx |
armv7 |
||||
OMAP4xxx |
armv7 |
||||
OMAP5xxx |
armv7 |
VFPv4 |
Cortex-A15 (ARMv7-A) + Cortex-M4 (ARMv7-ME) |
||
Qualcomm |
Snapdragon |
armv7 |
NEON[1] |
Qualcomm "Scorpion" core |
|
S5PC100 |
armv7 |
||||
A1x |
armv7 |
Reference
http://houh-1984.blog.163.com/
http://wiki.debian.org/ArmHardFloatPort
http://www.claudxiao.net/2012/02/armhf/
http://armin762.wordpress.com/2010/12/09/arm-hardfloat-and-gentoo/
本文介紹了ARM代碼編譯時的軟浮點(soft-float)和硬浮點(hard-float)的編譯以及連接實現時的不一樣。從VFP浮點單元的引入到軟浮點(soft-float)和硬浮點(hard-float)的概念,而後是在GCC和ARMCC RVCT工具鏈下的具體編譯參數。