Golang 協程調度

時間 2019-11-09

標籤 golang 調度欄目 Go 简体版

原文原文鏈接

1、線程模型

N:1模型，N個用戶空間線程在1個內核空間線程上運行。優點是上下文切換很是快可是沒法利用多核系統的優勢。
1:1模型，1個內核空間線程運行一個用戶空間線程。這種充分利用了多核系統的優點可是上下文切換很是慢，由於每一次調度都會在用戶態和內核態之間切換。（POSIX線程模型(pthread)，Java）
M:N模型，每一個用戶線程對應多個內核空間線程，同時也能夠一個內核空間線程對應多個用戶空間線程。Go打算採用這種模型，使用任意個內核模型管理任意個goroutine。這樣結合了以上兩種模型的優勢，但缺點就是調度的複雜性。

下面看看golang的協程調度golang

M：一個用戶空間線程，同時對應一個內核線程，相似posix pthread
P：表明運行的上下文環境, 也就是咱們上一節實現的調度器，一個調度器也會對應一個就緒隊列
G：goroutine，即協程

2、調度模型簡介

groutine能擁有強大的併發實現是經過GPM調度模型實現，下面就來解釋下goroutine的調度模型。緩存

Go的調度器內部有三個重要的結構：M，P，G
M：M是對內核級線程的封裝，數量對應真實的CPU數，一個M就是一個線程，goroutine就是跑在M之上的；M是一個很大的結構，裏面維護小對象內存cache（mcache）、當前執行的goroutine、隨機數發生器等等很是多的信息
G：表明一個goroutine，它有本身的棧，instruction pointer和其餘信息（正在等待的channel等等），用於調度。
P：P全稱是Processor，處理器，它的主要用途就是用來執行goroutine的。每一個Processor對象都擁有一個LRQ（Local Run Queue），未分配的Goroutine對象保存在GRQ（Global Run Queue ）中，等待分配給某一個P的LRQ中，每一個LRQ裏面包含若干個用戶建立的Goroutine對象。

Golang採用的是多線程模型，更詳細的說他是一個兩級線程模型，但它對系統線程（內核級線程）進行了封裝，暴露了一個輕量級的協程goroutine（用戶級線程）供用戶使用，而用戶級線程到內核級線程的調度由golang的runtime負責，調度邏輯對外透明。goroutine的優點在於上下文切換在徹底用戶態進行，無需像線程同樣頻繁在用戶態與內核態之間切換，節約了資源消耗。多線程

調度實現

從上圖中看，有2個物理線程M，每個M都擁有一個處理器P，每個也都有一個正在運行的goroutine。
P的數量能夠經過GOMAXPROCS()來設置，它其實也就表明了真正的併發度，即有多少個goroutine能夠同時運行。
圖中灰色的那些goroutine並無運行，而是出於ready的就緒態，正在等待被調度。P維護着這個隊列（稱之爲runqueue），
Go語言裏，啓動一個goroutine很容易：go function 就行，因此每有一個go語句被執行，runqueue隊列就在其末尾加入一個
goroutine，在下一個調度點，就從runqueue中取出（如何決定取哪一個goroutine？）一個goroutine執行。

當一個OS線程M0陷入阻塞時（以下圖)，P轉而在運行M1，圖中的M1多是正被建立，或者從線程緩存中取出。併發

當MO返回時，它必須嘗試取得一個P來運行goroutine，通常狀況下，它會從其餘的OS線程那裏拿一個P過來，
若是沒有拿到的話，它就把goroutine放在一個global runqueue裏，而後本身睡眠（放入線程緩存裏）。全部的P也會週期性的檢查global runqueue並運行其中的goroutine，不然global runqueue上的goroutine永遠沒法執行。

另外一種狀況是P所分配的任務G很快就執行完了（分配不均），這就致使了這個處理器P很忙，可是其餘的P還有任務，此時若是global runqueue沒有任務G了，那麼P不得不從其餘的P裏拿一些G來執行。通常來講，若是P從其餘的P那裏要拿任務的話，通常就拿run queue的一半，這就確保了每一個OS線程都能充分的使用，以下圖：

3、GPM建立相關問題

M和P的數量如何肯定？或者說什麼時候會建立M和P？

一、P的數量：函數

由啓動時環境變量$GOMAXPROCS或者是由runtime的方法GOMAXPROCS()決定（默認是1）。這意味着在程序執行的任意時刻都只有$GOMAXPROCS個goroutine在同時運行。

二、M的數量:線程

go語言自己的限制：go程序啓動時，會設置M的最大數量，默認10000.可是內核很難支持這麼多的線程數，因此這個限制能夠忽略。
runtime/debug中的SetMaxThreads函數，設置M的最大數量
一個M阻塞了，會建立新的M。

M與P的數量沒有絕對關係，一個M阻塞，P就會去建立或者切換另外一個M，因此，即便P的默認數量是1，也有可能會建立不少個M出來。debug

三、P什麼時候建立：在肯定了P的最大數量n後，運行時系統會根據這個數量建立n個P。3d

四、M什麼時候建立：沒有足夠的M來關聯P並運行其中的可運行的G。好比全部的M此時都阻塞住了，而P中還有不少就緒任務，就會去尋找空閒的M，而沒有空閒的，就會去建立新的M。協程

M選擇哪個P關聯？

M會選擇致使此M被建立的那個P關聯。

何時會切換P與M的關聯關係？

當M因系統調用而阻塞時（M上運行的G進入了系統調用的時候），M與P會分開，若是此時P的就緒隊列中還有任務，
P就會去關聯一個空閒的M，或者建立一個M進行關聯。（也就是說go不是像libtask同樣處理IO阻塞的？不肯定。）對象

就緒的G如何選擇進入哪一個P的就緒隊列？

默認狀況下：由於P的默認數量是1（M不必定是1），因此若是咱們不改變GOMAXPROCS，不管咱們在程序中用go語句建立多少個goroutine，它們都只會被塞入同一個P的就緒隊列中。
有多個P的狀況下：若是修改了GOMAXPROCS或者調用了runtime.GOMAXPROCS，運行時系統會把全部的G均勻的分佈在各個P的就緒隊列中。

如何保證每一個P的就緒隊列中都會有G

若是一個P的就緒隊列全部任務都執行完了，那麼P會嘗試從其餘P的就緒隊列中取出一部分到本身的就緒隊列中，以保證每一個P的就緒隊列都有任務能夠執行。

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。