arm gcc棧幀結構(1)

摘要:先看個例子: void test2(int a,int b,int c) { int k=a,j=b,m=c; } GCC反彙編: 00000064 test2: mov ip, sp //IP=SP;保管SP stmdb sp!, {fp, ip, lr, pc} //先對SP加4,再對fp,ip,lr,pc壓棧。---------1 sub fp, ip, #4 ; 0x4 /]c#

先看個例子:函數

void test2(int a,int b,int c)
{
int k=a,j=b,m=c;

}
GCC反彙編:
00000064 <test2>:
mov      ip, sp                   //IP=SP;保存SP
stmdb    sp!, {fp, ip, lr, pc}    //先對SP減4,再對fp,ip,lr,pc壓棧。---------1
sub      fp, ip, #4       ; 0x4    //fp=ip-4;此時fp指向棧裏面的「fp」
sub      sp, sp, #24      ; 0x18  //分配空間
str      r0, [fp, #-28]           //
str      r1, [fp, #-32]           //
str      r2, [fp, #-36]           //參數壓棧
ldr      r3, [fp, #-28]           //
str      r3, [fp, #-24]           //
ldr      r3, [fp, #-32]           //
str      r3, [fp, #-20]           //
ldr      r3, [fp, #-36]           //
str      r3, [fp, #-16]           //
sub      sp, fp, #12      ; 0xc    //sp=fp-12;此時sp指向棧裏面的lr
ldmia    sp, {fp, sp, pc}         //彈棧pc=lr,sp=ip,fp=fp。而後地址加4---------1
測試

彙編基礎:
stmdb    sp!, {fp, ip, lr, pc} //sp=sp-4,sp=pc;先壓PC
                               //sp=sp-4,sp=lr;再壓lr
                               //sp=sp-4,sp=ip;再壓ip
                               //sp=sp-4,sp=fp;再壓fp
ldmia    sp, {fp, sp, pc}       //和stmdb成對使用,
                               //fp=sp,sp=sp+4;先彈fp
                               //sp=sp,sp=sp+4;先彈sp,此處的彈出不會影響sp,由於ldmia是一個機器週期執行完的。
                               //pc=sp,sp=sp+4;先彈pc
LDRH           R0, [R13, #0xC] //加載無符號半字數據,即低16位
LDRB           R0, [R13, #0x4] //加載一字節數據,即低8位。
優化

注意:R11=fp;R12=ip;R13=SP;R14=LR;R15=PC;R0,R1,R2用於傳遞參數和存放函數返回值。
注意;低地址的寄存器被壓入低地址內存中,也就是說若是向下增加,高地址寄存器先壓,向上增加測試低地址先壓。
注意:根據「ARM-thumb 過程調用標準」:
1,  r0-r3 用做傳入函數參數,傳出函數返回值。在子程序調用之間,能夠將 r0-r3 用於任何用途。被調用函數在返回以前沒必要恢復 r0-r3。---若是調用函數須要再次使用 r0-r3 的內容,則它必須保留這些內容。
2, r4-r11 被用來存放函數的局部變量。若是被調用函數使用了這些寄存器,它在返回以前必須恢復這些寄存器的值。
3, r12 是內部調用暫時寄存器 ip。它在過程連接膠合代碼(例如,交互操做膠合代碼)中用於此角色。在過程調用之間,能夠將它用於任何用途。被調用函數在返回以前沒必要恢復 r12。
spa

4,寄存器 r13 是棧指針 sp。它不能用於任何其它用途。sp 中存放的值在退出被調用函數時必須與進入時的值相同。
5,寄存器 r14 是連接寄存器 lr。若是您保存了返回地址,則能夠在調用之間將 r14 用於其它用途,程序返回時要恢復
翻譯

6,寄存器 r15 是程序計數器 PC。它不能用於任何其它用途。指針

7,在中斷程序中,全部的寄存器都必須保護,編譯器會自動保護R4~R11,因此通常你本身只要在程序的開頭
sub lr,lr,#4
stmfd sp!,{r0-r3,r12,lr};保護R0~R3,R12,LR就能夠了,除非你用匯編人爲的去改變R4~R11的值。(具體去看UCOS os_cpu_a.S中的IRQ中斷的代碼)
ip

 

補充:內存

寄存器名字
Reg #  APCS   意義
R0 a1 工做寄存器
R1 a2 "
R2 a3 "
R3 a4 "
R4 v1 必須保護
R5 v2 "
R6 v3 "
R7 v4 "
R8 v5 "
R9 v6 "
R10 sl 棧限制
R11 fp 楨指針
R12 ip
R13 sp 棧指針
R14 lr 鏈接寄存器
R15 pc 程序計數器
get

回溯結構

寄存器 fp (楨指針)應當是零或者是指向棧回溯結構的列表中的最後一個結構,提供了一種追溯程序的方式,來反向跟蹤調用的函數。

回溯結構是:

地址高端

    保存代碼指針         [fp]          fp 指向這裏

    返回 lr 值           [fp, #-4]

    返回 sp 值           [fp, #-8]

    返回 fp 值           [fp, #-12]  指向下一個結構

    [保存的 sl]

    [保存的 v6]

    [保存的 v5]

    [保存的 v4]

    [保存的 v3]

    [保存的 v2]

    [保存的 v1]

    [保存的 a4]

    [保存的 a3]

    [保存的 a2]

    [保存的 a1]

    [保存的 f7]                           三個字

    [保存的 f6]                           三個字

    [保存的 f5]                           三個字

    [保存的 f4]                           三個字

pc 老是包含下一個要被執行的指令的位置。
lr (老是)包含着退出時要裝載到 pc 中的值。在 26-bit 位代碼中它還包含着 PSR。
sp 指向當前的棧塊(chunk)限制,或它的上面。這是用於複製臨時數據、寄存器和相似的東西到其中的地方。在 RISC OS 下,你有可選擇的至少 256 字節來擴展它。
fp 要麼是零,要麼指向回溯結構的最當前的部分。

 

 

example:

 咱們以jemalloc 中的ifree 方法分析:

1297void
1298je_free(void *ptr)
1299{
1300
1301	UTRACE(ptr, 0, 0);
1302	if (ptr != NULL)
1303		ifree(ptr);
1304}
1209
1210JEMALLOC_INLINE_C void
1211ifree(void *ptr)
1212{
1213	size_t usize;
1214	UNUSED size_t rzsize JEMALLOC_CC_SILENCE_INIT(0);
1215
1216	assert(ptr != NULL);
1217	assert(malloc_initialized || IS_INITIALIZER);
1218
1219	if (config_prof && opt_prof) {
1220		usize = isalloc(ptr, config_prof);
1221		prof_free(ptr, usize);
1222	} else if (config_stats || config_valgrind)
1223		usize = isalloc(ptr, config_prof);
1224	if (config_stats)
1225		thread_allocated_tsd_get()->deallocated += usize;
1226	if (config_valgrind && in_valgrind)
1227		rzsize = p2rz(ptr);
1228	iqalloc(ptr);
1229	JEMALLOC_VALGRIND_FREE(ptr, rzsize);
1230}

  這是ifree 方法的backtrace

 

  圖1

  下面是棧幀信息;能夠看出fram 0---2 是inline 沒有正真的棧幀,fram0--2 都屬於fram 3

  (gcc 加-fon-inline 編譯選項能夠忽略inline 關鍵字,達到fram0-2都有棧幀的效果)
 

 

  圖2

    看fram 3 能夠看出下面信息,以及當前的reg 值:

 

  圖3

 

(gdb) info frame 3

 pc = 0xb6ec503c in ifree (external/jemalloc/src/jemalloc.c:1223); saved pc 0xb6e8e7ac
 called by frame at 0xbefd65d8, caller of frame at 0xbefd65d0
 source language c.
 Arglist at 0xbefd6578, args: ptr=0xb2cfee20
 Locals at 0xbefd6578, Previous frame's sp is 0xbefd65d0
 Saved registers:
  r4 at 0xbefd65ac, r5 at 0xbefd65b0, r6 at 0xbefd65b4, r7 at 0xbefd65b8, r8 at 0xbefd65bc, r9 at 0xbefd65c0, r10 at 0xbefd65c4, r11 at 0xbefd65c8, lr at 0xbefd65cc

 

  翻譯:

      當前fp 棧幀基地址:Stack frame at 0xbefd65d0,是上一個棧幀的棧頂sp.

      當前執行的指令是pc(0xb6ec503c) in ifree (external/jemalloc/src/jemalloc.c:1223); 保存上一個調用要執行的下一條指令 pc 0xb6e8e7ac,即函數返回點地址,上一個調用過程的PC 的值會賦值給當前調用的LR.

      源文件是.c

      參數列表存儲的邊界是 0xbefd6578, 參數: ptr=0xb2cfee20

  本地變量存儲邊界是0xbefd6578, 上一個棧幀的棧頂sp 0xbefd65d0;本棧幀的地址範圍就是0xbefd65d0------0xbefd6578 sp 向低地址增加.

保存的上一個調用的調用場景(參照圖4,圖5):

         r4 存放在0xbefd65ac ......
      r4 at 0xbefd65ac, r5 at 0xbefd65b0, r6 at 0xbefd65b4, r7 at 0xbefd65b8, r8 at 0xbefd65bc, r9 at 0xbefd65c0, r10 at 0xbefd65c4, r11 at 0xbefd65c8, lr at 0xbefd65cc

  fram 3 的棧幀數據透析:

  咱們能夠看出ptr=0xb2cfee20 位於地址0xbefd65ac r4 存放的地址,爲何會用r4 的值傳遞參數?

   通常r4~r11 在上層調用中用來存放局部變量的值,須要在返回的時候恢復的,這個值得思考,猜測是優化的結果,可是優化的條件是?

 

  圖4

  lr 中保存的過程調用返回點.

 

  圖5 fram 3 ,ifree 方法的彙編:

   看ifree+0~~~~ifree+8 彙編代碼;sp=sp-4 以後傳輸lr的值給sp ,sp=sp-4 以後傳輸lr的值給sp

    連續入棧lr,r4~r11.總共4*9=36=0x20個字節,以後sp = sp - 0x34從大地址到小地址依次存放

    arglist locals;

   總共和sp 到sp 原值的offset是0x54; 看圖3正好是0xbefd65d0------0xbefd6578=0x58

   0xb6ec5008 <+0>:    ldmia    r7, {r3, r4, r7}
   0xb6ec500a <+2>:    movs    r2, r0
   0xb6ec500c <+4>:    stmdb    sp!, {r4, r5, r6, r7, r8, r9, r10, r11, lr}
   0xb6ec5010 <+8>:    sub    sp, #52    ; 0x34

 

  圖6

 

  圖7

相關文章
相關標籤/搜索