本文由雲+社區發表html
iOS開發過程當中不免會遇到卡頓等性能問題或者死鎖之類的問題,此時若是有調用堆棧將對解決問題頗有幫助。那麼在應用中如何來實時獲取函數的調用堆棧呢?本文參考了網上的一些博文,講述了使用mach thread的方式來獲取調用棧的步驟,其中會同步講述到棧幀的基本概念,而且經過對一個demo的彙編代碼的講解來方便理解獲取調用鏈的原理。api
先拋出一個棧幀的概念,解釋下什麼是棧幀。架構
應用中新建立的每一個線程都有專用的棧空間,棧能夠在線程期間自由使用。而線程中有千千萬萬的函數調用,這些函數共享進程的這個棧空間,那麼問題就來了,函數運行過程當中會有很是多的入棧出棧的過程,當函數返回backtrace的時候怎樣能精肯定位到返回地址呢?還有子函數所保存的一些寄存器的內容?這樣就有了棧幀的概念,即每一個函數所使用的棧空間是一個棧幀,全部的棧幀就組成了這個線程完整的棧。ide
棧幀函數
下面再拋出幾個概念:工具
寄存器中的fp,sp,lr,pc。性能
寄存器是和CPU聯繫很是緊密的一小塊內存,常常用於存儲一些正在使用的數據。對於32位架構armv7指令集的ARM處理器有16個寄存器,從r0到r15,每個都是32位比特。調用約定指定他們其中的一些寄存器有特殊的用途,例如:學習
不一樣指令集的寄存器數量可能會不一樣,pc、lr、sp、fp也可能使用其中不一樣的寄存器。後面咱們先忽略r11等寄存器編號,直接用fp,sp,lr來說述ui
以下圖所示,不論是較早的幀,仍是調用者的幀,仍是當前幀,它們的結構是徹底同樣的,由於每一個幀都是基於一個函數,幀伴隨着函數的生命週期一塊兒產生、發展和消亡。在這個過程當中用到了上面說的寄存器,fp幀指針,它老是指向當前幀的底部;sp棧指針,它老是指向當前幀的頂部。這兩個寄存器用來定位當前幀中的全部空間。編譯器須要根據指令集的規則當心翼翼地調整這兩個寄存器的值,一旦出錯,參數傳遞、函數返回均可能出現問題。spa
其實這裏這幾個寄存器會知足必定規則,好比:
而由此咱們能夠進一步想到,經過sp和fp所指出的棧幀能夠恢復出母函數的棧幀,不斷遞歸恢復便恢復除了調用堆棧。向下面代碼同樣,每次遞歸pc存儲的*(fp + 1)其實就是返回的地址,它在調用者的函數內,利用這個地址咱們能夠經過符號表還原出對應的方法名稱。
while(fp) { pc = *(fp + 1); fp = *fp; }
若是你非要問爲何會這樣,咱們能夠從彙編角度看下函數是怎麼調用的,從而更深入理解爲何fp老是存儲了上一個棧幀的fp的地址,而fp向前一個地址爲何老是lr?
寫以下一個demo程序,因爲我是在mac上作實驗,因此直接使用clang來編譯出可執行程序,而後再用hopper工具反彙編查看彙編代碼,固然也可直接使用clang的
-S
參數指定生產彙編代碼。
demo源碼
#import <Foundation/Foundation.h> int func(int a); int main (void) { int a = 1; func(a); return 0; } int func (int a) { int b = 2; return a + b; }
彙編語言
; ================ B E G I N N I N G O F P R O C E D U R E ================ ; Variables: ; var_4: -4 ; var_8: -8 ; var_C: -12 _main: 0000000100000f70 push rbp 0000000100000f71 mov rbp, rsp 0000000100000f74 sub rsp, 0x10 0000000100000f78 mov dword [rbp+var_4], 0x0 0000000100000f7f mov dword [rbp+var_8], 0x1 0000000100000f86 mov edi, dword [rbp+var_8] ; argument #1 for method _func 0000000100000f89 call _func 0000000100000f8e xor edi, edi 0000000100000f90 mov dword [rbp+var_C], eax 0000000100000f93 mov eax, edi 0000000100000f95 add rsp, 0x10 0000000100000f99 pop rbp 0000000100000f9a ret ; endp 0000000100000f9b nop dword [rax+rax] ; ================ B E G I N N I N G O F P R O C E D U R E ================ ; Variables: ; var_4: -4 ; var_8: -8 _func: 0000000100000fa0 push rbp ; CODE XREF=_main+25 0000000100000fa1 mov rbp, rsp 0000000100000fa4 mov dword [rbp+var_4], edi 0000000100000fa7 mov dword [rbp+var_8], 0x2 0000000100000fae mov edi, dword [rbp+var_4] 0000000100000fb1 add edi, dword [rbp+var_8] 0000000100000fb4 mov eax, edi 0000000100000fb6 pop rbp 0000000100000fb7 ret
須要注意,因爲是在mac上編譯出可執行程序,指令集已是x86-64,因此上文的fp、sp、lr、pc名稱和使用的寄存器發生了變化,但含義基本一致,對應關係以下:
接下來咱們看下具體的彙編代碼,能夠看到在main函數中在通過預處理和參數初始化後,經過call _func
來調用了func函數,這裏call _func
其實等價於兩個彙編命令:
Pushl %rip //保存下一條指令(第41行的代碼地址)的地址,用於函數返回繼續執行 Jmp _func //跳轉到函數foo
因而,當main函數調用了func函數後,會將下一行地址push進棧,至此,main函數的棧幀已經結束,而後跳轉到func的代碼處開始繼續執行。能夠看出,rip指向的函數下一條地址,即上文中所說的lr已經入棧,在棧幀的頂部。
而從func的代碼能夠看到,首先使用push rbp
將幀指針保存起來,而因爲剛跳轉到func函數,此時rbp實際上是上一個棧幀的幀指針,即它的值其實仍是上一個棧幀的底部地址,因此此步驟實際上是將上一個幀底部地址保存了下來。
下一句彙編語句mov rbp, rsp
將棧頂部地址rsp更新給了rbp,因而此時rbp的值就成了棧的頂部地址,也是當前棧幀的開始,即fp。而棧頂部又正好是剛剛push進去的存儲上一個幀指針地址的地址,因此rbp指向的時當前棧幀的底部,但其中保存的值是上一個棧幀底部的地址。
至此,也就解釋了爲何fp指向的地址存儲的內容是上一個棧幀的fp的地址,也解釋了爲何fp向前一個地址就正好是lr。
另一個比較重要的東西就是出入棧的順序,在ARM指令系統中是地址遞減棧,入棧操做的參數入棧順序是從右到左依次入棧,而參數的出棧順序則是從左到右的你操做。包括push/pop和LDMFD/STMFD等。
其實上面的幾個fp、lr、sp在mach內核提供的api中都有定義,咱們可使用對應的api拿到對應的值。以下即是64位和32位的定義
_STRUCT_ARM_THREAD_STATE64 { __uint64_t __x[29]; /* General purpose registers x0-x28 */ __uint64_t __fp; /* Frame pointer x29 */ __uint64_t __lr; /* Link register x30 */ __uint64_t __sp; /* Stack pointer x31 */ __uint64_t __pc; /* Program counter */ __uint32_t __cpsr; /* Current program status register */ __uint32_t __pad; /* Same size for 32-bit or 64-bit clients */ }; _STRUCT_ARM_THREAD_STATE { __uint32_t r[13]; /* General purpose register r0-r12 */ __uint32_t sp; /* Stack pointer r13 */ __uint32_t lr; /* Link register r14 */ __uint32_t pc; /* Program counter r15 */ __uint32_t cpsr; /* Current program status register */ };
因而,咱們只要拿到對應的fp和lr,而後遞歸去查找母函數的地址,最後將其符號化,便可還原出調用棧。
總結概括了下,獲取調用棧須要下面幾步:
thread_suspend(main_thread);
_STRUCT_MCONTEXT ctx; #if defined(__x86_64__) mach_msg_type_number_t count = x86_THREAD_STATE64_COUNT; thread_get_state(thread, x86_THREAD_STATE64, (thread_state_t)&ctx.__ss, &count); #elif defined(__arm64__) _STRUCT_MCONTEXT ctx; mach_msg_type_number_t count = ARM_THREAD_STATE64_COUNT; thread_get_state(thread, ARM_THREAD_STATE64, (thread_state_t)&ctx.__ss, &count); #endif
#if defined(__x86_64__) uint64_t pc = ctx.__ss.__rip; uint64_t sp = ctx.__ss.__rsp; uint64_t fp = ctx.__ss.__rbp; #elif defined(__arm64__) uint64_t pc = ctx.__ss.__pc; uint64_t sp = ctx.__ss.__sp; uint64_t fp = ctx.__ss.__fp; #endif
while(fp) { pc = *(fp + 1); fp = *fp; }
這一步咱們其實就是使用上面的方法來依次迭代出調用鏈上的函數地址,代碼以下
void* t_fp[2]; vm_size_t len = sizeof(record); vm_read_overwrite(mach_task_self(), (vm_address_t)(fp),len, (vm_address_t)t_fp, &len); do { pc = (long)t_fp[1] // lr老是在fp的上一個地址 // 依次記錄pc的值,這裏先只是打印出來 printf(pc) vm_read_overwrite(mach_task_self(),(vm_address_t)m_cursor.fp[0], len, (vm_address_t)m_cursor.fp,&len); } while (fp);
上面代碼便會從下到上依次打印出調用棧函數中的地址,這個地址老是在函數調用地方的下一個地址,咱們就須要拿這個地址還原出對應的符號名稱。
thread_resume(main_thread);
這一步主要是將已經得到的調用鏈上的地址分別解析出對應的符號。主要是參考了運行時獲取函數調用棧 的方法,其中用到的dyld連接mach-o文件的基礎知識,後續會專門針對這裏總結一篇文章。
enumerateSegment(header, [&](struct load_command *command) { if (command->cmd == LC_SYMTAB) { struct symtab_command *symCmd = (struct symtab_command *)command; uint64_t baseaddr = 0; enumerateSegment(header, [&](struct load_command *command) { if (command->cmd == LC_SEGMENT_64) { struct segment_command_64 *segCmd = (struct segment_command_64 *)command; if (strcmp(segCmd->segname, SEG_LINKEDIT) == 0) { baseaddr = segCmd->vmaddr - segCmd->fileoff; return true; } } return false; }); if (baseaddr == 0) return false; nlist_64 *nlist = (nlist_64 *)(baseaddr + slide + symCmd->symoff); uint64_t strTable = baseaddr + slide + symCmd->stroff; uint64_t offset = UINT64_MAX; int best = -1; for (int k = 0; k < symCmd->nsyms; k++) { nlist_64 &sym = nlist[k]; uint64_t d = pcSlide - sym.n_value; if (offset >= d) { offset = d; best = k; } } if (best >= 0) { nlist_64 &sym = nlist[best]; std::cout << "SYMBOL: " << (char *)(strTable + sym.n_un.n_strx) << std::endl; } return true; } return false; });
此文已由做者受權騰訊雲+社區在各渠道發佈
獲取更多新鮮技術乾貨,能夠關注咱們騰訊雲技術社區-雲加社區官方號及知乎機構號