Linux系統調用原理

操做系統經過系統調用爲運行於其上的進程提供服務。html

當用戶態進程發起一個系統調用, CPU 將切換到 內核態 並開始執行一個 內核函數 。 內核函數負責響應應用程序的要求,例如操做文件、進行網絡通信或者申請內存資源等。linux

原文地址: https://learn-linux.readthedocs.io
玩轉Linux舊羣已滿,請加新羣: 278378501
歡迎關注咱們的公衆號: 小菜學編程 (coding-fan)

舉一個最簡單的例子,應用進程須要輸出一行文字,須要調用 write 這個系統調用:shell

#include <string.h>
#include <unistd.h>

int main(int argc, char *argv[])
{
    char *msg = "Hello, world!\n";
    write(1, msg, strlen(msg));

    return 0;
}
註解

讀者可能會有些疑問——輸出文本不是用 printf 等函數嗎?編程

確實是。 printf 是更高層次的庫函數,創建在系統調用之上,實現數據格式化等功能。 所以,本質上仍是系統調用起決定性做用。微信

調用流程

那麼,在應用程序內,調用一個系統調用的流程是怎樣的呢?網絡

咱們以一個假設的系統調用 xyz 爲例,介紹一次系統調用的全部環節。app

系統調用流程圖

如上圖,系統調用執行的流程以下:函數

  1. 應用程序 代碼調用系統調用( xyz ),該函數是一個包裝系統調用的 庫函數 ;
  2. 庫函數 ( xyz )負責準備向內核傳遞的參數,並觸發 軟中斷 以切換到內核;
  3. CPU 被 軟中斷 打斷後,執行 中斷處理函數 ,即 系統調用處理函數 ( system_call);
  4. 系統調用處理函數 調用 系統調用服務例程 ( sys_xyz ),真正開始處理該系統調用;

執行態切換

應用程序 ( application program )與 庫函數 ( libc )之間, 系統調用處理函數 ( system call handler )與 系統調用服務例程 ( system call service routine )之間, 均是普通函數調用,應該不難理解。 而 庫函數 與 系統調用處理函數 之間,因爲涉及用戶態與內核態的切換,要複雜一些。學習

Linux 經過 軟中斷 實現從 用戶態 到 內核態 的切換。 用戶態 與 內核態 是獨立的執行流,所以在切換時,須要準備 執行棧 並保存 寄存器 。spa

內核實現了不少不一樣的系統調用(提供不一樣功能),而 系統調用處理函數 只有一個。 所以,用戶進程必須傳遞一個參數用於區分,這即是 系統調用號 ( system call number )。 在 Linux 中, 系統調用號 通常經過 eax 寄存器 來傳遞。

總結起來, 執行態切換 過程以下:

  1. 應用程序 在 用戶態 準備好調用參數,執行 int 指令觸發 軟中斷 ,中斷號爲 0x80 ;
  2. CPU 被軟中斷打斷後,執行對應的 中斷處理函數 ,這時便已進入 內核態 ;
  3. 系統調用處理函數 準備 內核執行棧 ,並保存全部 寄存器 (通常用匯編語言實現);
  4. 系統調用處理函數 根據 系統調用號 調用對應的 C 函數—— 系統調用服務例程 ;
  5. 系統調用處理函數 準備 返回值 並從 內核棧 中恢復 寄存器 ;
  6. 系統調用處理函數 執行 ret 指令切換回 用戶態 ;

編程實踐

下面,經過一個簡單的程序,看看應用程序如何在 用戶態 準備參數並經過 int 指令觸發 軟中斷 以陷入 內核態 執行 系統調用 :

.section .rodata

msg:
    .ascii "Hello, world!\n"

.section .text

.global _start

_start:
    # call SYS_WRITE
    movl $4, %eax
    # push arguments
    movl $1, %ebx
    movl $msg, %ecx
    movl $14, %edx
    int $0x80

    # Call SYS_EXIT
    movl $1, %eax
    # push arguments
    movl $0, %ebx
    # initiate
    int $0x80

這是一個彙編語言程序,程序入口在 _start 標籤以後。

第 12 行,準備 系統調用號 :將常數 4 放進 寄存器 eax 。 系統調用號 4 表明 系統調用 SYS_write , 咱們將經過該系統調用向標準輸出寫入一個字符串。

第 14-16 行, 準備系統調用參數:第一個參數放進 寄存器 ebx ,第二個參數放進 ecx , 以此類推。

write 系統調用須要 3 個參數:

  • 文件描述符 ,標準輸出文件描述符爲 1 ;
  • 寫入內容(緩衝區)地址;
  • 寫入內容長度(字節數);

第 17 行,執行 int 指令觸發軟中斷 0x80 ,程序將陷入內核態並由內核執行系統調用。 系統調用執行完畢後,內核將負責切換回用戶態,應用程序繼續執行以後的指令( 從 20 行開始 )。

第 20-24 行,調用 exit 系統調用,以便退出程序。

註解

注意到,這裏必須顯式調用 exit 系統調用退出程序。 不然,程序將繼續往下執行,最終遇到 段錯誤segmentation fault )!

讀者可能很好奇——在寫 C 語言或者其餘程序時,這個調用並非必須的!

這是由於 C 庫( libc )已經幫你把髒活累活都幹了。

接下來,咱們編譯並執行這個彙編語言程序:

$ ls
hello_world-int.S
$ as -o hello_world-int.o hello_world-int.S
$ ls
hello_world-int.o  hello_world-int.S
$ ld -o hello_world-int hello_world-int.o
$ ls
hello_world-int  hello_world-int.o  hello_world-int.S
$ ./hello_world-int
Hello, world!

其實,將 系統調用號 和 調用參數 放進正確的 寄存器 並觸發正確的 軟中斷 是個重複的麻煩事。 C 庫已經把這髒累活給幹了——試試 syscall 函數吧!

#include <string.h>
#include <sys/syscall.h>
#include <unistd.h>

int main(int argc, char *argv[])
{
    char *msg = "Hello, world!\n";
    syscall(SYS_write, 1, msg, strlen(msg));

    return 0;
}

下一步

訂閱更新,獲取更多學習資料,請關注咱們的 微信公衆號 :

小菜學編程

參考文獻

  1. Serg Iakovlev
  2. write(2) - Linux manual page
  3. syscall(2) - Linux manual page
  4. _exit(2) - Linux manual page
相關文章
相關標籤/搜索