在上一篇文章中,實現了對大於號(>
)的處理,那麼對if
表達式的編譯也就是信手拈來的事了,不解釋太多。在本篇中,將會講述一下如何產生能夠調用來自於C語言標準庫的exit(3)
函數的彙編代碼。git
在Common Lisp中並無一個叫作EXIT
的內置函數,因此如同以前實現的_exit
同樣,我會新增一種須要識別的(first expr)
,即符號exit
。爲了能夠調用C語言標準庫中的exit
函數,須要遵循調用約定。對於exit
這種只有一個參數的函數而言,情形比較簡單,只須要跟對_exit
同樣處理便可。剛開始,我寫下的代碼是這樣的github
(defun jjcc2 (expr globals) ;; 省略沒必要要的內容 (cond ;; 省略沒必要要的內容 ((member (first expr) '(_exit exit)) ;; 暫時以硬編碼的方式識別一個函數是否來自於C語言的標準庫 `((movl ,(get-operand expr 0) %edi) (call :|_exit|)))))
對(exit 1)
進行編譯,會獲得以下的代碼segmentfault
.data .section __TEXT,__text,regular,pure_instructions .globl _main _main: MOVL $1, %EDI CALL _exit
不過這樣的代碼通過編譯連接以後,一運行就會遇到段錯誤(segmentation fault)。通過一番放狗搜索後,才知道原來在macOS上調用C函數的時候,須要先將棧對齊到16字節——我將其理解爲將指向棧頂的指針對齊到16字節。因而乎,我將jjcc2
修改成以下的形式app
(defun jjcc2 (expr globals) ;; 省略沒必要要的內容 (cond ;; 省略沒必要要的內容 ((member (first expr) '(_exit exit)) ;; 暫時以硬編碼的方式識別一個函數是否來自於C語言的標準庫 `((movl ,(get-operand expr 0) %edi) ;; 據這篇回答(https://stackoverflow.com/questions/12678230/how-to-print-argv0-in-nasm)所說,在macOS上調用C語言函數,須要將棧對齊到16位 ;; 僞裝要對齊的是棧頂地址。由於棧頂地址是往低地址增加的,因此只須要將地址的低16位抹掉就能夠了 (and ,(format nil "$0x~X" #XFFFFFFF0) %esp) (call :|_exit|)))))
結果發現仍是不行。最後,實在沒轍了,只好先寫一段簡單的C代碼,而後用gcc -S
生成彙編代碼,來看看究竟應當如何處理這個棧的對齊要求。一番瞎折騰以後,發現原來是要處理RSP
寄存器而不是ESP
寄存器——我也不曉得這是爲何,ESP
不就是RSP
的低32位而已麼。函數
最後,把jjcc2
寫成下面這樣後,終於能夠成功編譯(exit 1)
了測試
(defun jjcc2 (expr globals) "支持兩個數的四則運算的編譯器" (check-type globals hash-table) (cond ((eq (first expr) '+) `((movl ,(get-operand expr 0) %eax) (movl ,(get-operand expr 1) %ebx) (addl %ebx %eax))) ((eq (first expr) '-) `((movl ,(get-operand expr 0) %eax) (movl ,(get-operand expr 1) %ebx) (subl %ebx %eax))) ((eq (first expr) '*) ;; 將兩個數字相乘的結果放到第二個操做數所在的寄存器中 ;; 由於約定了用EAX寄存器做爲存放最終結果給continuation用的寄存器,因此第二個操做數應當爲EAX `((movl ,(get-operand expr 0) %eax) (movl ,(get-operand expr 1) %ebx) (imull %ebx %eax))) ((eq (first expr) '/) `((movl ,(get-operand expr 0) %eax) (cltd) (movl ,(get-operand expr 1) %ebx) (idivl %ebx))) ((eq (first expr) 'progn) (let ((result '())) (dolist (expr (rest expr)) (setf result (append result (jjcc2 expr globals)))) result)) ((eq (first expr) 'setq) ;; 編譯賦值語句的方式比較簡單,就是將被賦值的符號視爲一個全局變量,而後將eax寄存器中的內容移動到這裏面去 ;; TODO: 這裏expr的second的結果必須是一個符號才行 ;; FIXME: 不知道應該賦值什麼比較好,先隨便寫個0吧 (setf (gethash (second expr) globals) 0) (values (append (jjcc2 (third expr) globals) ;; 爲了方便stringify函數的實現,這裏直接構造出RIP-relative形式的字符串 `((movl %eax ,(get-operand expr 0)))) globals)) ;; ((eq (first expr) '_exit) ;; ;; 由於知道_exit只須要一個參數,因此將它的第一個操做數塞到EDI寄存器裏面就能夠了 ;; ;; TODO: 更好的寫法,應該是有一個單獨的函數來處理這種參數傳遞的事情(以符合calling convention的方式) ;; `((movl ,(get-operand expr 0) %edi) ;; (movl #x2000001 %eax) ;; (syscall))) ((eq (first expr) '>) ;; 爲了能夠把比較以後的結果放入到EAX寄存器中,以我目前不完整的彙編語言知識,能夠想到的方法以下 (let ((label-greater-than (intern (symbol-name (gensym)) :keyword)) (label-end (intern (symbol-name (gensym)) :keyword))) ;; 根據這篇文章(https://en.wikibooks.org/wiki/X86_Assembly/Control_Flow#Comparison_Instructions)中的說法,大於號左邊的數字應該放在CMP指令的第二個操做數中,右邊的放在第一個操做數中 `((movl ,(get-operand expr 0) %eax) (movl ,(get-operand expr 1) %ebx) (cmpl %ebx %eax) (jg ,label-greater-than) (movl $0 %eax) (jmp ,label-end) ,label-greater-than (movl $1 %eax) ,label-end))) ((eq (first expr) 'if) ;; 假定if語句的測試表達式的結果也是放在%eax寄存器中的,因此只須要拿%eax寄存器中的值跟0作比較便可(相似於C語言) (let ((label-else (intern (symbol-name (gensym)) :keyword)) (label-end (intern (symbol-name (gensym)) :keyword))) (append (jjcc2 (second expr) globals) `((cmpl $0 %eax) (je ,label-else)) (jjcc2 (third expr) globals) `((jmp ,label-end) ,label-else) (jjcc2 (fourth expr) globals) `(,label-end)))) ((member (first expr) '(_exit exit)) ;; 暫時以硬編碼的方式識別一個函數是否來自於C語言的標準庫 `((movl ,(get-operand expr 0) %edi) ;; 據這篇回答(https://stackoverflow.com/questions/12678230/how-to-print-argv0-in-nasm)所說,在macOS上調用C語言函數,須要將棧對齊到16位 ;; 僞裝要對齊的是棧頂地址。由於棧頂地址是往低地址增加的,因此只須要將地址的低16位抹掉就能夠了 (and ,(format nil "$0x~X" #XFFFFFFFFFFFFFFF0) %rsp) (call :|_exit|)))))
生成的彙編代碼以下編碼
.data .section __TEXT,__text,regular,pure_instructions .globl _main _main: MOVL $1, %EDI AND $0xFFFFFFFFFFFFFFF0, %RSP CALL _exit
好了,這個時候我就在想,若是想要支持其它來自C語言標準庫的函數的話,只要依葫蘆畫瓢就行了,好像還挺簡單的——天真的我如此天真地想着。指針
全文完rest
閱讀原文code