ARM系列文章,請點擊如下彙總連接:
linux
《從0學arm合集》web
1、gcc 內聯彙編
內聯彙編即在C中直接使用匯編語句進行編程,使程序能夠在C程序中實現C語言不能完成的一些工做,例如,在下面幾種狀況中必須使用內聯彙編或嵌入型彙編。編程
-
程序中使用飽和算術運算(Saturating Arithmetic) -
程序須要對協處理器進行操做 -
在C程序中完成對程序狀態寄存器的操做
格式:
__asm__ __volatile__("asm code"
:output
:input
:changed registers);
asm或__asm__開頭,小括號+分號,括號內容寫彙編指令。指令+\n\t 用雙引號引上。微信
參數
「asm code」主要填寫彙編代碼:架構
"mov r0, r0\n\t"
"mov r1,r1\n\t"
"mov r2,r2"
「output(asm->C)」用於定義輸出的參數,一般只能是變量:app
:"constraint" (variable)
"constraint"用於定義variable的存放位置:
r 表示使用任何可用的寄存器
m 表示使用變量的內存地址
+ 可讀可寫
= 只寫
& 表示該輸出操做數不能使用輸入部分使用過的寄存器,只能用"+&"或"=&"的方式使用
「input(C->asm)」用於定義輸入的參數,能夠是變量也能夠是當即數:編輯器
:"constraint" (variable/immediate)
"constraint"用於定義variable的存放位置:
r 表示使用任何可用的寄存器(當即數和變量均可以)
m 表示使用變量的內存地址
i 表示使用當即數
Note:函數
-
使用__asm__和__volatile__表示編譯器將不檢查後面的內容,而是直接交給彙編器。 -
若是但願編譯器爲你優化,__volatile__能夠不加 -
沒有asm code也不能省略"" -
沒有前面的和中間的部分,不能夠相應的省略: -
沒有changed 部分,必須相應的省略: -
最後的;不能省略,對於C語言來講這是一條語句 -
彙編代碼必須放在一個字符串內,且字符串中間不能直接按回車換行,能夠寫成多個字符串,注意中間不能有任何符號,這樣就會將兩個字符串合併爲一個 -
指令之間必需要換行,還可使用\t使指令在彙編中保持整齊
舉例
例1:無參數,無返回值 這種狀況,output和input能夠省略:學習
asm
( //彙編指令
"mrs r0,cpsr \n\t"
"bic r0,r0,#0x80 \n\t"
"msr cpsr,r0 \n\t"
);
例2:有參數 ,有返回值 讓內聯彙編作加法運算,求a+b,結果存在c中flex
int a =100, b =200, c =0;
asm
(
"add %0,%1,%2\n\t"
: "=r"(c)
: "r"(a),"r"(b)
: "memory"
);
%0 對應變量c %1 對應變量a %2 對應變量b
例3:有參數 2 ,有返回值
讓內聯彙編作加法運算,求a+b,結果存在sum中,把a-b的存在d中
asm volatile
(
"add %[op1],%[op2],%[op3]\n\t"
"sub %[op4],%[op2],%[op3]\n\t"
:[op1]"=r"(sum),[op4]"=r"(d)
:[op2]"r"(a),[op3]"r"(b)
:"memory"
);
%0 對應變量c %1 對應變量a %2 對應變量b
3、ATPCS規則:(ARM、thumber程序調用規範)
爲了使單獨編譯的C語言程序和彙編程序之間可以相互調用,必須爲子程序之間的調用規定必定的規則.ATPCS就是ARM程序和THUMB程序中子程序調用的基本規則。
基本ATPCS規定了在子程序調用時的一些基本規則,包括下面3方面的內容:
-
各寄存器的使用規則及其相應的名稱。 -
數據棧的使用規則。 -
參數傳遞的規則。
1. 寄存器的使用必須知足下面的規則:
-
1)子程序間經過寄存器R0一R3來傳遞參數,這時,寄存器R0~R3能夠記做A1-A4。被調用的子程序在返回前無需恢復寄存器R0~R3的內容。
-
-
2)在子程序中,使用寄存器R4~R11來保存局部變量.這時,寄存器 R4 ~ R11能夠記做V1 ~ V8。若是在子程序中使用到了寄存器V1~V8中的某些寄存器,子程序進入時必須保存這些寄存器的值,在返回前必須恢復這些寄存器的值;對於子程序中沒有用到的寄存器則沒必要進行這些操做。在Thumb程序中,一般只能使用寄存器R4~R7來保存局部變量。
-
3)寄存器R12用做過程調用時的臨時寄存器(用於保存SP,在函數返回時使用該寄存器出棧), 記做ip。在子程序間的鏈接代碼段中常有這種使用規則。
-
4)寄存器R13用做數據棧指針,記做sp。在子程序中寄存器R13不能用做其餘用途。寄存器sp在進入子程序時的值和退出子程序時的值必須相等。
-
5)寄存器R14稱爲鏈接寄存器,記做lr。它用於保存子程序的返回地址。若是在子程序中保存了返回地址,寄存器R14則能夠用做其餘用途。
-
6)寄存器R15是程序計數器,記做pc。它不能用做其餘用途。
ATPCS下ARM寄存器的命名:
寄存器 | 別名 | 功能 |
---|---|---|
R0 | a1 | 工做寄存器 |
R1 | a2 | 工做寄存器 |
R2 | a3 | 工做寄存器 |
R3 | a4 | 工做寄存器 |
R4 | v1 | 必須保護;局部變量寄存器 |
R5 | v2 | 必須保護;局部變量寄存器 |
R6 | v3 | 必須保護;局部變量寄存器 |
R7 | v4 | 必須保護;局部變量寄存器 |
R8 | v5 | 必須保護;局部變量寄存器 |
R9 | v6 | 必須保護;局部變量寄存器 |
R10 | sl | 棧限制 |
R11 | fp | 幀指針 |
R12 | ip | 指令指針 |
R13 | sp | 棧指針 |
R14 | lr | 鏈接寄存器 |
二、堆棧使用規則:
ATPCS規定堆棧爲FD類型,即滿遞減堆棧。而且堆棧的操做是8字節對齊。
而對於彙編程序來講,若是目標文件中包含了外部調用,則必須知足如下條件:
-
外部接口的數據棧必定是8位對齊的,也就是要保證在進入該彙編代碼後,直到該彙編程序調用外部代碼之間,數據棧的棧指針變化爲偶數個字;
-
在彙編程序中使用PRESERVE8僞操做告訴鏈接器,本彙編程序是8字節對齊的.
三、參數的傳遞規則:
根據參數個數是否固定,能夠將子程序分爲參數個數固定的子程序和參數個數可變的子程序.這兩種子程序的參數傳遞規則是不一樣的.
1.參數個數可變的子程序參數傳遞規則
對於參數個數可變的子程序,當參數不超過4個時,可使用寄存器R0~R3來進行參數傳遞,當參數超過4個時,還可使用數據棧來傳遞參數.
在參數傳遞時,將全部參數看作是存放在連續的內存單元中的字數據。而後,依次將各名字數據傳送到寄存器R0,R1,R2,R3; 若是參數多於4個,將剩餘的字數據傳送到數據棧中,入棧的順序與參數順序相反,即最後一個字數據先入棧.
按照上面的規則,一個浮點數參數能夠經過寄存器傳遞,也能夠經過數據棧傳遞,也可能一半經過寄存器傳遞,另外一半經過數據棧傳遞。
舉例:
void func(a,b,c,d,e)
a -- r0
b -- r1
c -- r2
d -- r3
e -- 棧
2.參數個數固定的子程序參數傳遞規則
對於參數個數固定的子程序,參數傳遞與參數個數可變的子程序參數傳遞規則不一樣,若是系統包含浮點運算的硬件部件。
浮點參數將按照下面的規則傳遞: (1)各個浮點參數按順序處理; (2)爲每一個浮點參數分配FP寄存器;
分配的方法是,知足該浮點參數須要的且編號最小的一組連續的FP寄存器.第一個整數參數經過寄存器R0~R3來傳遞,其餘參數經過數據棧傳遞.
三、子程序結果返回規則
-
1.結果爲一個32位的整數時,能夠經過寄存器R0返回. -
2.結果爲一個64位整數時,能夠經過R0和R1返回,依此類推. -
3.對於位數更多的結果,須要經過調用內存來傳遞.
舉例:
使用r0 接收返回值
int func1(int m, int n)
m -- r0
n -- r1
返回值給 r0
「爲何有的編程規範要求自定義函數的參數不要超過4個?」答:由於參數超過4個就須要壓棧退棧,而壓棧退棧須要增長不少指令週期。對於參數比較多的狀況,咱們能夠把數據封裝到結構體中,而後傳遞結構體變量的地址。
4、C語言和彙編相互調用
C和彙編相互調用要特別注意遵照相應的ATPCS規則。
1. C調用匯編
例1:c調用匯編文件中函數帶返回值 簡化代碼以下,代碼架構能夠參考《7. 從0開始學ARM-GNU僞指令、代碼編譯,lds使用》。
;.asm
add:
add r2,r0,r1
mov r0,r2
MOV pc, lr
main.c
extern int add(int a,int b);
printf("%d \n",add(2,3));
-
a->r0,b->r1 -
返回值經過r0返回計算結果給c代碼
例2,用匯編實現一個strcopy函數
;.asm
.global strcopy
strcopy: ;R0指向目的字符串 ;R1指向源字符串
LDRB R2, [R1], #1 ;加載字字符並更新源字符串指針地址
STRB R2, [R0], #1 ;存儲字符並更新目的字符串指針地址
CMP R2, #0 ;判斷是否爲字符串結尾
BNE strcopy ;若是不是,程序跳轉到strcopy繼續循環
MOV pc, lr ;程序返回
//.c
#include <stdio.h>
extern void strcopy(char* des, const char* src);
int main(){
const char* srcstr = "yikoulinux";
char desstr[]="test";
strcopy(desstr, srcstr);
return 0;
}
2. 彙編調用C
//.c
int fcn(int a, int b , int c, int d, int e)
{
return a+b+c+d+e;
}
;.asm ;
.text .global _start
_start:
STR lr, [sp, #-4]! ;保存返回地址lr
ADD R1, R0, R0 ;計算2*i(第2個參數)
ADD R2, R1, R0 ;計算3*i(第3個參數)
ADD R3, R1, R2 ;計算5*i
STR R3, [SP, #-4]! ;第5個參數經過堆棧傳遞
ADD R3, R1, R1 ;計算4*i(第4個參數)
BL fcn ;調用C程序
ADD sp, sp, #4 ;從堆棧中刪除第五個參數
.end
假設程序進入f時,R0中的值爲i ;
int f(int i){
return fcn(i, 2*i, 3*i, 4*i, 5*i);
}
5、內核實例
爲了讓讀者有個更加深入的理解, 之內核中的例子爲例:
arch/arm/kernel/setup.c
void notrace cpu_init(void)
{
unsigned int cpu = smp_processor_id();----獲取CPU ID
struct stack *stk = &stacks[cpu];----獲取該CPU對於的irq abt和und的stack指針
……
#ifdef CONFIG_THUMB2_KERNEL
#define PLC "r"----Thumb-2下,msr指令不容許使用當即數,只能使用寄存器。
#else
#define PLC "I"
#endif __asm__ (
"msr cpsr_c, %1\n\t"----讓CPU進入IRQ mode
"add r14, %0, %2\n\t"----r14寄存器保存stk->irq
"mov sp, r14\n\t"----設定IRQ mode的stack爲stk->irq
"msr cpsr_c, %3\n\t"
"add r14, %0, %4\n\t"
"mov sp, r14\n\t"----設定abt mode的stack爲stk->abt
"msr cpsr_c, %5\n\t"
"add r14, %0, %6\n\t"
"mov sp, r14\n\t"----設定und mode的stack爲stk->und
"msr cpsr_c, %7"---回到SVC mode
:----上面是code,下面的output部分是空的
: "r" (stk),----對應上面代碼中的%0
PLC (PSR_F_BIT | PSR_I_BIT | IRQ_MODE),----對應上面代碼中的%1
"I" (offsetof(struct stack, irq[0])),----對應上面代碼中的%2
PLC (PSR_F_BIT | PSR_I_BIT | ABT_MODE),----以此類推,下面不贅述
"I" (offsetof(struct stack, abt[0])),
PLC (PSR_F_BIT | PSR_I_BIT | UND_MODE),
"I" (offsetof(struct stack, und[0])),
PLC (PSR_F_BIT | PSR_I_BIT | SVC_MODE)
: "r14");----上面是input操做數列表,r14是要clobbered register列表
}
推薦閱讀
【5】 4. 從0開始學ARM-ARM彙編指令其實很簡單
進羣,請加一口君我的微信,帶你嵌入式入門進階。
本文分享自微信公衆號 - 一口Linux(yikoulinux)。
若有侵權,請聯繫 support@oschina.cn 刪除。
本文參與「OSC源創計劃」,歡迎正在閱讀的你也加入,一塊兒分享。