重溫操做系統——「共享」CPU

時間 2019-11-30

標籤重溫系統共享 cpu 简体版

原文原文鏈接

操做系統是一門重要的基礎知識，瞭解這門基礎知識不只能幫助咱們寫出更優秀的程序，還能提升咱們的學習能力。當我發現有時候常常看不懂大佬的文章，聽不懂大佬間談話，看不懂項目文檔的時候，我想我是時候補充一下基礎知識了。本系列篇章內容基於Operating Systems: Three Easy Pieces的讀後感，是一份操做系統知識的概括總結。linux

「共享」CPU

咱們的電腦使用一塊CPU「同時」運行着各式各樣的應用程序，操做系統經過分時共享的方式，讓每一個程序輪流使用CPU，就好像每一個程序都有本身的CPU同樣（就好像共享單車那樣）。爲了使CPU可以被各進程分時共享，操做系統要掌握分配CPU使用權的權利，同時也要履行服務好各項進程的義務。本篇文章就操做系統如何行使「權利」與履行「義務」作了一些概括總結——操做系統如何掌握系統的控制權？操做系統如何協調各項進程「共享」CPU？算法

限制用戶進程行爲

操做系統是有「被害妄想症」的（事實上，它必需要有被害妄想症...），它不信任用戶進程，總想着用戶進程充滿惡意，會阻礙系統的正常運做。因而乎，只有操做系統纔有權限直接訪問諸如內存，硬盤，以及其餘系統資源。一但有用戶進程試圖越過操做系統執行這些「危險」的訪問操做，該進程就會被殺死。讓用戶進程直接訪問內存，硬盤等資源的確也是很危險的一件事，試想一下若是一個進程能夠任意讀取和修改其餘進程的內存數據，那麼基本上全部的進程都不能正常運行了。因此操做系統必需要限制用戶進程的行爲。編程

用戶態(user mode)與內核態(kernel mode)

操做系統經過劃分用戶態和內核態來限制用戶進程的行爲:數據結構

用戶態：用戶進程運行在用戶態，只能執行部分低權限的指令。
內核態：操做系統運行在內核態，具有執行全部指令的權限。

CPU硬件支持

爲了區分用戶態和內核態，操做系統須要硬件的幫助。CPU要提供某種權限機制，來區分用戶態和內核態的訪問權限。例如，x86 CPU提供4種特權級別（privilege level）：0,1,2,3，等級越低權限越高（能夠執行的指令種類越多）。在任一時刻，CPU都是在一個特定的特權級下運行，若是進程執行了不符合當前特權級別的指令，CPU會拋出異常，該進程會崩潰退出，從而起到保護做用。函數

Unix/linux操做系統只用到了Ring0和Ring3：操做系統的特權級別是Ring0，而用戶進程的特權級別是Ring3。

系統調用（System Call）

然而，咱們的應用程序老是會須要訪問內存以及磁盤的。但在用戶態下，用戶進程並無執行直接訪問這些硬件資源的指令權限。用戶進程須要經過操做系統提供的編程接口——系統調用（system call）與操做系統進行交互，由操做系統在內核態中來執行相應的指令。用戶進程經過觸發軟中斷（trap）讓CPU陷入內核態，由操做系統在內核態處理用戶請求。處理完畢後，操做系統經過執行return-from-trap指令似CPU返回用戶態，將結果返回給用戶進程，繼續用戶進程的執行。性能

中斷處理

當某些急切須要CPU處理的事件發生的時候，能夠由軟件或硬件觸發一箇中斷信號，讓CPU停下手頭上的事情，立馬處理當前觸發中斷的事件，中斷處理完畢後，CPU將繼續執行被暫停的程序。每一箇中斷都有一箇中斷編號，其對應的處理函數入口地址保存在中斷向量表（interrupt vector table）中。在操做系統的啓動階段，操做系統會設置中斷向量表，當中斷產生的時候，CPU根據中斷號查詢中斷向量表，從而得知執行哪個中斷處理函數。能夠對中斷進行一個簡單的分類：學習

硬中斷：由外部硬件觸發的中斷，好比按下鍵盤，或者點擊鼠標。
軟中斷：由軟件主動觸發的中斷，好比系統調用，在linux系統中，一般經過執行int 0x80彙編指令來觸發系統調用軟中斷（中斷編號爲0x80）。

系統調用編號

假設系統調用的中斷編號爲0x80，CPU可以經過0x80得知這是一個系統調用，執行系統調用中斷處理函數。可是咱們的系統調用中斷處理函數還不知道究竟是什麼系統調用，是讀寫文件？仍是分配內存？操做系統經過給系統調用編號來解決這個問題。當要執行系統調用的時候，用戶進程會將系統調用編號（system-call number），以及調用參數，傳給系統調用中斷處理函數（經過CPU寄存器傳遞），後者根據系統調用編號執行相應的代碼。編碼

圖解系統調用過程

圖片修改自 pages.cs.wisc.edu/~remzi/OSTE… Figure 6.2操作系統

在操做系統啓動階段初始化中斷向量表，並告知CPU硬件中斷向量表的訪問地址。當用戶進程執行系統調用的時候，CPU將部分寄存器信息保存到當前進程的內核棧中，切換至內核態，開始執行系統調用中斷處理函數。系統調用中斷處理函數根據系統調用編號執行相應系統調用，執行完畢後經過return-from-trap指令，恢復發生中斷前的寄存器內容，切換至用戶態，繼續執行用戶進程。指針

後文有對①②步驟的詳細說明。

進程間切換

當用戶進程正在CPU上運行時，意味着咱們的操做系統並無運行。既然操做系統沒有在運行，那實際上操做系統是沒有辦法作任何事的。爲了讓操做系統可以奪回CPU的控制權，咱們再一次須要硬件的幫助——藉助時鐘設備來按期觸發時鐘中斷（timer interrupt）。當時鍾中斷觸發後，當前進程會暫停執行，CPU切換至內核態，執行中斷處理函數（interrupt handler），此時，操做系統從新得到了CPU的使用權，根據進程調度算法的選擇，它能夠暫停當前進程運行，運行另外一個進程。

上下文切換（Context Switch）

當進程從新得到CPU使用權的時候，CPU須要知道他上一次執行到哪裏才能正確繼續執行下去。當操做系統決定要執行進程切換的時候，會執行上下文切換（context switch）——保存當前進程的上下文信息，恢復即將執行的進程的上下文信息。

清閒的午後，你正在房間裏看書（閱讀進程）。忽然線上出bug了（中斷），你夾好書籤（保存上下文信息）合上書，火急火燎打開電腦開始排查（切換到修bug進程）。處理完成以後，回到房間繼續看書。多虧合書以前夾好了書籤，打開書你即可以繼續上次的閱讀了。

進程控制塊（Process Control Block）

進程控制塊（PCB）是操做系統用於描述一個進程信息的數據結構。進程的上下文信息保存在PCB中。PCB保存下列信息：

程序計數器（PC）：用於標識下一條指令執行的地址。
CPU寄存器信息：保存進程用到的寄存器信息，用於進程恢復執行的時候，恢復進程的狀態。
...

更多信息可參考：en.wikipedia.org/wiki/Proces…

內核棧（Kernel Stack）

操做系統爲每一個進程獨立分配一段棧空間，當進程因某種緣由（中斷/上下文切換）暫停運行時，用於保存CPU或進程的上下文信息。當進程須要繼續執行的時候，從內核棧中恢復這些信息。

若是僅僅是中斷（例如系統調用），而未發生進程切換，其實並不須要保存進程的上下文信息。具體緣由在後續的圖解中詳細說明。

圖解進程切換步驟

進程切換步驟如圖所示：

圖片修改自 pages.cs.wisc.edu/~remzi/OSTE… Figure 6.3

時鐘中斷的產生暫停了進程A的運行，由硬件將部分寄存器信息保存到內核棧，並切換至內核態。在時鐘中斷處理函數中，若是操做系統決定要從進程A切換到進程B（根據進程調度算法），開始調用switch()方法執行上下文切換：

將進程用到的寄存器——例如程序計數器（PC），堆棧指針寄存器(SP)，以及其餘通用寄存器保存到PCB中。
根據進程B的PCB信息，恢復進程B的寄存器內容。經過設置堆棧指針寄存器(SP)，切換到進程B的內核棧。

上下文切換完成後，操做系統執行return-from-trap指令，恢復進程B的寄存器，切換到用戶態，開始執行進程B。

爲何保存/恢復了兩次寄存器內容？

圖中①②③④步驟都涉及到保存寄存器或恢復寄存器的操做。實際上，只有②跟③是屬於上下文切換的範疇——從進程A的上下文切換至進程B的上下文。而①和④步驟由CPU硬件完成，由中斷觸發，跟進程切換沒有直接關係。其目的是——保存CPU進入內核態前的狀態，確保調用return-from-trap指令後，能恢復正確的用戶態狀態（進入內核態前的狀態），其實也能夠把這個步驟歸稱之爲上下文切換，只不過這是CPU內核態與用戶態之間的上下文切換（mode switch）。

小結

操做系統經過區分用戶態和內核態，配合CPU硬件提供的權限機制來限制用戶進程的執行權限。用戶進程只能經過系統調用來訪問硬件資源（內存，硬盤等）。操做系統經過時鐘中斷來保持對操做系統的控制，使用上下文切換的方式來保障進程在CPU上正常切換。執行一次系統調用或上下文切換的代價仍是挺高的（CPU作了不少數據搬運的工做），在編碼中，咱們能夠經過減小系統調用的次數來提高程序的性能（好比合並讀寫操做）。