編譯大於運算符

原定的計劃中這一篇應當是要講如何編譯if表達式的,可是我發現沒什麼東西能夠做爲if的test-form的部分的表達式,因此以爲,要不仍是先實現一下比較兩個數字這樣子的功能吧。說幹就幹,我決定用大於運算符來做爲例子——大於運算符就是指>啦。因此,個人目標是要編譯下面這樣的代碼git

(> 1 2)

而且比較以後的結果要放在EAX寄存器中。鑑於如今這門語言還很是地簡陋,沒有布爾類型這樣子的東西,因此在此仿照C語言的處置方式,以數值0表示邏輯假,其它的值表示邏輯真。因此上面的表達式在編譯成彙編代碼並最終運行後,應當能夠看到EAX寄存器中的值爲0。github

爲了編譯大於運算符,而且將結果放入到EAX寄存器中,須要用到新的指令CMPJG,以及JMP了。個人想法是,先將第一個操做數放入到EAX寄存器,將第二個操做數放入到EBX寄存器。而後,使用CMP指令比較這兩個寄存器。若是EAX中的數值大於EBX,那麼就使用JG指令跳到一個MOV指令上,這道MOV會將寄存器EAX的值修改成1;不然,JG不被執行,執行後續的一道MOV指令,將數值0寫入到EAX寄存器,而後使用JMP跳走,避免又執行到了剛纔的第一道MOV指令。思路仍是挺簡單的。app

在修改jjcc2以前,還須要在inside-out/aux中對>予以支持,但沒什麼特別的,就是往member的參數中加入>這個符號而已。以後,將jjcc2改成以下的形式ide

(defun jjcc2 (expr globals)
  "支持兩個數的四則運算的編譯器"
  (check-type globals hash-table)
  (cond ((eq (first expr) '+)
         `((movl ,(get-operand expr 0) %eax)
           (movl ,(get-operand expr 1) %ebx)
           (addl %ebx %eax)))
        ((eq (first expr) '-)
         `((movl ,(get-operand expr 0) %eax)
           (movl ,(get-operand expr 1) %ebx)
           (subl %ebx %eax)))
        ((eq (first expr) '*)
         ;; 將兩個數字相乘的結果放到第二個操做數所在的寄存器中
         ;; 由於約定了用EAX寄存器做爲存放最終結果給continuation用的寄存器,因此第二個操做數應當爲EAX
         `((movl ,(get-operand expr 0) %eax)
           (movl ,(get-operand expr 1) %ebx)
           (imull %ebx %eax)))
        ((eq (first expr) '/)
         `((movl ,(get-operand expr 0) %eax)
           (cltd)
           (movl ,(get-operand expr 1) %ebx)
           (idivl %ebx)))
        ((eq (first expr) 'progn)
         (let ((result '()))
           (dolist (expr (rest expr))
             (setf result (append result (jjcc2 expr globals))))
           result))
        ((eq (first expr) 'setq)
         ;; 編譯賦值語句的方式比較簡單,就是將被賦值的符號視爲一個全局變量,而後將eax寄存器中的內容移動到這裏面去
         ;; TODO: 這裏expr的second的結果必須是一個符號才行
         ;; FIXME: 不知道應該賦值什麼比較好,先隨便寫個0吧
         (setf (gethash (second expr) globals) 0)
         (values (append (jjcc2 (third expr) globals)
                         ;; 爲了方便stringify函數的實現,這裏直接構造出RIP-relative形式的字符串
                         `((movl %eax ,(get-operand expr 0))))
                 globals))
        ((eq (first expr) '_exit)
         ;; 由於知道_exit只須要一個參數,因此將它的第一個操做數塞到EDI寄存器裏面就能夠了
         ;; TODO: 更好的寫法,應該是有一個單獨的函數來處理這種參數傳遞的事情(以符合calling convention的方式)
         `((movl ,(get-operand expr 0) %edi)
           (movl #x2000001 %eax)
           (syscall)))
        ((eq (first expr) '>)
         ;; 爲了能夠把比較以後的結果放入到EAX寄存器中,以我目前不完整的彙編語言知識,能夠想到的方法以下
         (let ((label-greater-than (intern (symbol-name (gensym)) :keyword))
               (label-end (intern (symbol-name (gensym)) :keyword)))
           ;; 根據這篇文章(https://en.wikibooks.org/wiki/X86_Assembly/Control_Flow#Comparison_Instructions)中的說法,大於號左邊的數字應該放在CMP指令的第二個操做數中,右邊的放在第一個操做數中
           `((movl ,(get-operand expr 0) %eax)
             (movl ,(get-operand expr 1) %ebx)
             (cmpl %ebx %eax)
             (jg ,label-greater-than)
             (movl $0 %eax)
             (jmp ,label-end)
             ,label-greater-than
             (movl $1 %eax)
             ,label-end)))))

而後即可以在REPL中運行下列代碼了函數

(let* ((ht (make-hash-table))
       (asm (jjcc2 (inside-out '(_exit (> 1 2))) ht)))
  (stringify asm ht))

輸出的彙編代碼爲rest

.data
G809: .long 0
        .section __TEXT,__text,regular,pure_instructions
        .globl _main
_main:
        MOVL $1, %EAX
        MOVL $2, %EBX
        CMPL %EBX, %EAX
        JG G810
        MOVL $0, %EAX
        JMP G811
G810:
        MOVL $1, %EAX
G811:
        MOVL %EAX, G809(%RIP)
        MOVL G809(%RIP), %EDI
        MOVL $33554433, %EAX
        SYSCALL

編譯連接運行後,就能夠獲得預期的結果了。code

全文完。orm

閱讀原文htm

相關文章
相關標籤/搜索