內核調度模型

時間 2019-11-11

標籤內核調度模型简体版

原文原文鏈接

今天偶然談起了進程的相關概念，發現其中有許多不清晰的地方，現就以上的概念作一些研究，所參考的資料所有來自於網絡，因此對於其中不正確的地方，歡迎你們給我指正，讓我可以對以上概念更加清晰。html

好，首先理清以上幾個概念，先來看「內核線程」。此處要申明的一點是，從我所看到的資料來看（《Linux內核設計與實現》、《深刻理解Linux內核》以及網上的諸多文章），只有「內核線程」的概念，不存在所謂的「內核進程」。此處對於內核線程的具體定義我並無找到，不過能夠從它的功能出發，窺探一二。linux

關於內核線程的做用主要參考自如下文章：http://blog.csdn.net/kickxxx/article/details/9211381web

內核線程的做用主要有：算法

週期性的將dirty內存頁同步到磁盤設備上。好比 bpflush線程週期性的把dirty數據寫回磁盤
內存頁不多的狀況下，把內存page 交換到磁盤空間。好比kswapd，系統會爲每個NUMA建立一個kswapd進程，可是在非NUMA系統上，則僅有一個kswapd
管理延時動做
實現文件系統的事物日誌
主要包括兩種類型的內核線程：shell

線程按週期性間隔運行，檢測特定資源的使用，在用量超出或者低於預置的限制時採起行動
在線程啓動後則一直等待，直到內核線程請求執行某一特定的操做。
同時內核線程是由內核本身建立的線程，也叫作守護線程(deamon)。在終端上用命令」ps -Al」列出的全部進程中，名字以k開關以d結尾的每每都是內核線程，好比kthreadd、kswapd。網絡

既然是內核線程是一個單獨的概念，那麼與用戶線程之間必定存在某些區別，主要區別參考自如下文章：http://www.2ndmoon.net/weblog/?p=603數據結構

內核線程與用戶線程的相同點是：多線程

都由do_fork()建立，每一個線程都有獨立的task_struct和內核棧；
都參與調度，內核線程也有優先級，會被調度器平等地換入換出
不一樣之處在於：併發

內核線程只工做在內核態中；而用戶線程則既能夠運行在內核態（執行系統調用時），也能夠運行在用戶態；
內核線程沒有用戶空間，因此對於一個內核線程來講，它的0~3G的內存空間是空白的，它的current->mm是空的，與內核使用同一張頁表；而用戶線程則能夠看到完整的0~4G內存空間。
在Linux內核啓動的最後階段，系統會建立兩個內核線程，一個是init，一個是kthreadd。其中init線程的做用是運行文件系統上的一系列」init」腳本，並啓動shell進程，因此init線程稱得上是系統中全部用戶進程的祖先，它的pid是1。kthreadd線程是內核的守護線程，在內核正常工做時，它永遠不退出，是一個死循環，它的pid是2。函數

經過上述不一樣之處的對比能夠發現，內核線程沒有用戶內存空間，與之相對的是用戶進程（注意，此處不是用戶線程，用戶線程內存空間與用戶進程空間之間存在的必定差別，具體差別能夠參考我以前的博文），用戶進程同時具有內核空間與用戶空間，在進行系統調用時用戶進程會由用戶內存空間陷入內核內存空間。之因此此處採用內核線程與用戶進程（而非用戶線程）進行對比，是因爲內核線程（kernel thread）是「獨立運行在內核空間的標準進程」（以上這句話摘自《linux內核設計與實現》），所以從功能上看內核線程一方面具備進程的概念特色——具備獨立功能的程序關於某個數據集合上的一次執行活動，是系統進行資源分配的單位，同時內核線程又具備線程的概念特色——進程內的一個可調度實體。

好了經過以上分析基本能夠分清「內核線程（kernel thread）」、「用戶進程」、「用戶線程」這幾個基本概念。這裏要補充的一點是以上幾個概念所有是在邏輯層面上的，從實現的角度來看linux內核自己並不支持線程這一律念，linux 將全部的線程都看成進程來實現。內核並無準備特別的調度算法或是定義特別的數據結構來表徵線程。相反，線程僅僅被視爲一個與其餘進程（概念上應該是線程）共享某些資源的進程（概念上應該是線程）。每一個線程都擁有惟一隸屬於本身的task_struct，因此在內核中，它看起來就像是一個普通的進程（只是線程和其餘一些進程共享某些資源，如地址空間）。關於這一點能夠經過系統調用clone的實現來驗證，不管是fork、vfork、kthread_create最後都是要調用do_fork，而do_fork就是根據不一樣的函數參數，對一個進程所需的資源進行分配。在linux2.6以前，內核並不支持線程的概念，僅經過輕量級進程（lightweight process）模擬線程，一個用戶線程對應一個內核線程（內核輕量級進程），這種模型最大的特色是線程調度由內核完成了，而其餘線程操做（同步、取消）等都是核外的線程庫（LinuxThread）函數完成的。但這個問題還存在不少的問題，具體問題請見http://www.ibm.com/developerworks/cn/linux/kernel/l-thread/index.html 這篇文章中的第6小節。在linux2.6以後，爲了徹底兼容posix標準，linux2.6首先對內核進行了改進，引入了線程組的概念（仍然用輕量級進程表示線程），有了這個概念就能夠將一組線程組織稱爲一個進程，如此經過這個改變，linux內核正式支持多線程特性。以上是邏輯上的改變，在實現上主要的改變就是在task_struct中加入tgid字段，這個字段就是用於表示線程組id的字段。在用戶線程庫方面，也使用NPTL代替LinuxThread。不一樣調度模型上仍然採用「1對1」模型，關於線程的調度模型，接下來會詳細分析。

對於linux內核中對於多線程支持的變化歷史請見如下這篇blog：http://blog.sina.com.cn/s/blog_631d3a630102uwn2.html

關於LinuxThread與NPTL的對比請見這篇文章：http://blog.csdn.net/ixidof/article/details/24579879

對於2.4內核中線程的實現，請見這篇文章http://www.ibm.com/developerworks/cn/linux/kernel/l-thread/index.html

接下來來看看內核線程與用戶線程之間的對應關係。首先從原理上出發，對內核線程與用戶線程之間的對應關係進行分析。

如今在支持多線程的操做系統中通常採用三種調度模型，分別是「一對一模型」、「多對一模型」、「多對多模型」。

以上內容參考自下述兩篇blog

http://www.cnblogs.com/zhaoyl/p/3620204.html

1）「一對一模型」

一對一模型中，每一個用戶線程都對應各自的內核調度實體。內核會對每一個線程進行調度，能夠調度到其餘處理器上面。固然由內核來調度的結果就是：線程的每次操做會在用戶態和內核態切換。另外，內核爲每一個線程都映射調度實體，若是系統出現大量線程，會對系統性能有影響。但該模型的實用性仍是高於多對一的線程模型。LinuxThread與NPTL都是採用這種模型。

在linux中經過LWP（lightweight process）做爲線程概念的支持，輕量級線程(LWP)是一種由內核支持的用戶線程。它是基於內核線程的高級抽象，所以只有先支持內核線程，纔能有LWP。每個進程有一個或多個LWPs，每一個LWP由一個內核線程支持。這種模型實際上就是恐龍書上所提到的一對一線程模型。在這種實現的操做系統中，LWP就是用戶線程。

因爲每一個LWP都與一個特定的內核線程關聯，所以每一個LWP都是一個獨立的線程調度單元。即便有一個LWP在系統調用中阻塞，也不會影響整個進程的執行。

輕量級進程具備侷限性。首先，大多數LWP的操做，如創建、析構以及同步，都須要進行系統調用。系統調用的代價相對較高：須要在user mode和kernel mode中切換。其次，每一個LWP都須要有一個內核線程支持，所以LWP要消耗內核資源（內核線程的棧空間）。所以一個系統不能支持大量的LWP。圖也是盜的。

2）「多對一模型」
多對一線程模型中，線程的建立、調度、同步的全部細節所有由進程的用戶空間線程庫來處理。用戶態線程的不少操做對內核來講都是透明的，由於不須要內核來接管，這意味不須要內核態和用戶態頻繁切換。線程的建立、調度、同步處理速度很是快。固然線程的一些其餘操做仍是要通過內核，如IO讀寫。這樣致使了一個問題：當多線程併發執行時，若是其中一個線程執行IO操做時，內核接管這個操做，若是IO阻塞，用戶態的其餘線程都會被阻塞，由於這些線程都對應同一個內核調度實體。在多處理器機器上，內核不知道用戶態有這些線程，沒法把它們調度到其餘處理器，也沒法經過優先級來調度。這對線程的使用是沒有意義的！

3）「多對多模型」

用戶線程庫仍是徹底創建在用戶空間中，所以用戶線程的操做仍是很廉價，所以能夠創建任意多須要的用戶線程。操做系統提供了 LWP 做爲用戶線程和內核線程之間的橋樑。 LWP 仍是和前面提到的同樣，具備內核線程支持，是內核的調度單元，而且用戶線程的系統調用要經過 LWP ，所以進程中某個用戶線程的阻塞不會影響整個進程的執行。用戶線程庫將創建的用戶線程關聯到 LWP 上， LWP 與用戶線程的數量不必定一致。當內核調度到某個 LWP 上時，此時與該 LWP 關聯的用戶線程就被執行。

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。