協程(coroutine)顧名思義就是「協做的例程」(co-operative routines)。跟具備操做系統概念的線程不同,協程是在用戶空間利用程序語言的語法語義就能實現邏輯上相似多任務的編程技巧。實際上協程的概念比線程還要早,按照 Knuth 的說法「子例程是協程的特例」,一個子例程就是一次子函數調用,那麼實際上協程就是類函數同樣的程序組件,你能夠在一個線程裏面輕鬆建立數十萬個協程,就像數十萬次函數調用同樣。只不過子例程只有一個調用入口起始點,返回以後就結束了,而協程入口既能夠是起始點,又能夠從上一個返回點繼續執行,也就是說協程之間能夠經過 yield 方式轉移執行權,對稱(symmetric)、平級地調用對方,而不是像例程那樣上下級調用關係。固然 Knuth 的「特例」指的是協程也能夠模擬例程那樣實現上下級調用關係,這就叫非對稱協程(asymmetric coroutines)。javascript
咱們舉一個例子來看看一種對稱協程調用場景,你們最熟悉的「生產者-消費者」事件驅動模型,一個協程負責生產產品並將它們加入隊列,另外一個負責從隊列中取出產品並使用它。爲了提升效率,你想一次增長或刪除多個產品。僞代碼能夠是這樣的:php
1
2
3
4
5
6
7
8
9
10
11
12
13
|
# producer coroutine
loop
while
queue is not full
create some new items
add the items to queue
yield to consumer
# consumer coroutine
loop
while
queue is not empty
remove some items from queue
use the items
yield to producer
|
大多數教材上拿這種模型做爲多線程的例子,實際上多線程在此的應用仍是顯得有點「重量級」,因爲缺少 yield 語義,線程之間不得不使用同步機制來避免產生全局資源的竟態,這就不可避免產生了休眠、調度、切換上下文一類的系統開銷,並且線程調度還會產生時序上的不肯定性。而對於協程來講,「掛起」的概念只不過是轉讓代碼執行權並調用另外的協程,待到轉讓的協程告一段落後從新獲得調用並從掛起點「喚醒」,這種協程間的調用是邏輯上可控的,時序上肯定的,可謂一切盡在掌握中。html
當今一些具有協程語義的語言,比較重量級的如C#、erlang、golang,以及輕量級的python、lua、javascript、ruby,還有函數式的scala、scheme等。相比之下,做爲原生態語言的 C 反而處於尷尬的地位,緣由在於 C 依賴於一種叫作棧幀的例程調用,例程內部的狀態量和返回值都保留在堆棧上,這意味着生產者和消費者相互之間沒法實現平級調用,固然你能夠改寫成把生產者做爲主例程而後將產品做爲傳遞參數調用消費者例程,這樣的代碼寫起來費力不討好並且看起來會很難受,特別當協程數目達到十萬數量級,這種寫法就過於僵化了。java
這就引出了協程的概念,若是將每一個協程的上下文(好比程序計數器)保存在其它地方而不是堆棧上,協程之間相互調用時,被調用的協程只要從堆棧之外的地方恢復上次出讓點以前的上下文便可,這有點相似於 CPU 的上下文切換,遺憾的是彷佛只有更底層的彙編語言才能作到這一點。python
難道 C 語言只能用多線程嗎?幸運的是,C 標準庫給咱們提供了兩種協程調度原語:一種是setjmp/longjmp,另外一種是 ucontext 組件,它們內部(固然是用匯編語言)實現了協程的上下文切換,相較之下前者在應用上會產生至關的不肯定性(好比很差封裝,具體說明參考聯機文檔),因此後者應用更普遍一些,網上絕大多數 C 協程庫也是基於 ucontext 組件實現的。程序員
在此,我來介紹一種「蠅量級」的開源 C 協程庫 protothreads。這是一個所有用 ANSI C 寫成的庫,之因此稱爲「蠅量級」的,就是說,實現已經不能再精簡了,幾乎就是原語級別。事實上 protothreads 整個庫不須要連接加載,由於全部源碼都是頭文件,相似於 STL 這樣不依賴任何第三方庫,在任何平臺上可移植;總共也就 5 個頭文件,有效代碼量不足 100 行;API 都是宏定義的,因此不存在調用開銷;最後,每一個協程的空間開銷是 2 個字節(是的,你沒有看錯,就是一個 short 單位的「棧」!)固然這種精簡是要以使用上的侷限爲代價的,接下來的分析會說明這一點。golang
先來看看 protothreads 做者,Adam Dunkels,一位來自瑞典皇家理工學院的計算機天才帥哥。話說這哥們挺有意思的,寫了好多輕量級的做品,都是 BSD 許可證。順便說一句,輕量級開源軟件全世界多如牛毛,可像這位哥們寫得如此出名的並很少。好比嵌入式網絡操做系統 Contiki,國人耳熟能詳的 TCP/IP 協議棧uIP 和 lwIP 也是出自其手。上述這些軟件都是通過數十年企業級應用的考驗,質量之高可想而知。算法
不少人會好奇如此「蠅量級」的代碼到底是怎麼實現的呢?在分析 protothreads 源碼以前,我先來給你們補一補 C 語言的基礎課;-^)簡而言之,這利用了 C 語言特性上的一個「奇技淫巧」,並且這種技巧恐怕連許多具有十年以上經驗的 C 程序員老手都不見得知曉。固然這裏先要聲明我不是推薦你們都這麼用,實際上這是以破壞語言的代碼規範爲代價,在一些嚴肅的項目工程中須要謹慎對待,除非你想被炒魷魚。shell
下面的教程來自於一位 ARM 工程師、天才黑客 Simon Tatham(開源 Telnet/SSH 客戶端 PuTTY 和彙編器NASM 的做者,吐槽一句,PuTTY的源碼號稱是全部正式項目裏最難 hack 的 C,你應該猜到做者是什麼語言出身)的博文:Coroutines in C。中文譯文在這裏。編程
咱們知道 python 的 yield 語義功能相似於一種迭代生成器,函數會保留上次的調用狀態,並在下次調用時會從上個返回點繼續執行。用 C 語言來寫就像這樣:
1
2
3
4
5
|
int
function(
void
) {
int
i;
for
(i = 0; i < 10; i++)
return
i;
/* won't work, but wouldn't it be nice */
}
|
連續對它調用 10 次,它能分別返回 0 到 9。該怎樣實現呢?能夠利用 goto 語句,若是咱們在函數中加入一個狀態變量,就能夠這樣實現:
1
2
3
4
5
6
7
8
9
10
11
12
13
|
int
function(
void
) {
static
int
i, state = 0;
switch
(state) {
case
0:
goto
LABEL0;
case
1:
goto
LABEL1;
}
LABEL0:
/* start of function */
for
(i = 0; i < 10; i++) {
state = 1;
/* so we will come back to LABEL1 */
return
i;
LABEL1:;
/* resume control straight after the return */
}
}
|
這個方法是可行的。咱們在全部須要 yield 的位置都加上標籤:起始位置加一個,還有全部 return 語句以後都加一個。每一個標籤用數字編號,咱們在狀態變量中保存這個編號,這樣就能在咱們下次調用時告訴咱們應該跳到哪一個標籤上。每次返回前,更新狀態變量,指向到正確的標籤;不論調用多少次,針對狀態變量的 switch 語句都能找到咱們要跳轉到的位置。
但這仍是難看得很。最糟糕的部分是全部的標籤都須要手工維護,還必須保證函數中的標籤和開頭 switch 語句中的一致。每次新增一個 return 語句,就必須想一個新的標籤名並將其加到 switch 語句中;每次刪除 return 語句時,一樣也必須刪除對應的標籤。這使得維護代碼的工做量增長了一倍。
仔細想一想,其實咱們能夠不用 switch 語句來決定要跳轉到哪裏去執行,而是直接利用 switch 語句自己來實現跳轉:
1
2
3
4
5
6
7
8
9
10
11
|
int
function(
void
) {
static
int
i, state = 0;
switch
(state) {
case
0:
/* start of function */
for
(i = 0; i < 10; i++) {
state = 1;
/* so we will come back to "case 1" */
return
i;
case
1:;
/* resume control straight after the return */
}
}
}
|
酷!沒想到 switch-case 語句能夠這樣用,其實說白了 C 語言就是脫胎於彙編語言的,switch-case 跟 if-else 同樣,無非就是彙編的條件跳轉指令的另類實現而已(這也間接解釋了爲什麼彙編程序員常常揶揄 C 語言是「大便同樣的代碼」)。咱們還能夠用 __LINE__ 宏使其更加通常化:
1
2
3
4
5
6
7
8
9
10
11
|
int
function(
void
) {
static
int
i, state = 0;
switch
(state) {
case
0:
/* start of function */
for
(i = 0; i < 10; i++) {
state = __LINE__ + 2;
/* so we will come back to "case __LINE__" */
return
i;
case
__LINE__:;
/* resume control straight after the return */
}
}
}
|
這樣一來咱們能夠用宏提煉出一種範式,封裝成組件:
1
2
3
4
5
6
7
8
9
10
|
#define Begin() static int state=0; switch(state) { case 0:
#define Yield(x) do { state=__LINE__; return x; case __LINE__:; } while (0)
#define End() }
int
function(
void
) {
static
int
i;
Begin();
for
(i = 0; i < 10; i++)
Yield(i);
End();
}
|
怎麼樣,看起來像不像發明了一種全新的語言?實際上咱們利用了 switch-case 的分支跳轉特性,以及預編譯的 __LINE__ 宏,實現了一種隱式狀態機,最終實現了「yield 語義」。
還有一個問題,當你歡天喜地地將這種不爲人知的技巧運用到你的項目中,併成功地拿去向你的上司邀功問賞的時候,你的上司會怎樣看待你的代碼呢?你的宏定義中大括號沒有匹配完整,在代碼塊中包含了未用到的 case,Begin 和 Yield 宏裏面不完整的七拼八湊……你簡直就是公司裏不遵照編碼規範的反面榜樣!
彆着急,在原文中 Simon Tatham 大牛幫你找到一個堅決的反駁理由,我以爲對程序員來講簡直是金玉良言。
將編程規範用在這裏是不對的。文章裏給出的示例代碼不是很長,也不很複雜,即使以狀態機的方式改寫仍是可以看懂的。可是隨着代碼愈來愈長,改寫的難度將愈來愈大,改寫對直觀性形成的損失也變得至關至關大。
想想,一個函數若是包含這樣的小代碼塊:
1
2
3
|
case
STATE1:
/* perform some activity */
if
(condition) state = STATE2;
else
state = STATE3;
|
對於看代碼的人說,這和包含下面小代碼塊的函數沒有多大區別:
1
2
3
|
LABEL1:
/* perform some activity */
if
(condition)
goto
LABEL2;
else
goto
LABEL3;
|
是的,這兩個函數的結構在視覺上是同樣的,而對於函數中實現的算法,兩個函數都同樣不利於查看。由於你使用協程的宏而炒你魷魚的人,同樣會由於你寫的函數是由小塊的代碼和 goto 語句組成而吼着炒了你。只是此次他們沒有冤枉你,由於像那樣設計的函數會嚴重擾亂算法的結構。
編程規範的目標就是爲了代碼清晰。若是將一些重要的東西,像 switch、return 以及 case 語句,隱藏到起「障眼」做用的宏中,從編程規範的角度講,能夠說你擾亂了程序的語法結構,而且違背了代碼清晰這一要求。可是咱們這樣作是爲了突出程序的算法結構,而算法結構偏偏是看代碼的人更想了解的。
任何編程規範,堅持犧牲算法清晰度來換取語法清晰度的,都應該重寫。若是你的上司由於使用了這一技巧而解僱你,那麼在保安把你往外拖的時候要不斷告訴他這一點。
原文做者最後給出了一個 MIT 許可證的 coroutine.h 頭文件。值得一提的是,正如文中所說,這種協程實現方法有個使用上的侷限,就是協程調度狀態的保存依賴於 static 變量,而不是堆棧上的局部變量,實際上也沒法用局部變量(堆棧)來保存狀態,這就使得代碼不具有可重入性和多線程應用。後來做者補充了一種技巧,就是將局部變量包裝成函數參數傳入的一個虛構的上下文結構體指針,而後用動態分配的堆來「模擬」堆棧,解決了線程可重入問題。但這樣一來反而有損代碼清晰,好比全部局部變量都要寫成對象成員的引用方式,特別是局部變量不少的時候很麻煩,再好比宏定義 malloc/free 的玩法過於託大,不易控制,搞很差還增長了被炒魷魚的風險(只不過此次是你活該)。
我我的認爲,既然協程自己是一種單線程的方案,那麼咱們應該假定應用環境是單線程的,不存在代碼重入問題,因此咱們能夠大膽地使用 static 變量,維持代碼的簡潔和可讀性。事實上咱們也不該該在多線程環境下考慮使用這麼簡陋的協程,非要用的話,前面提到 glibc 的 ucontext 組件也是一種可行的替代方案,它提供了一種協程私有堆棧的上下文,固然這種用法在跨線程上也並不是沒有限制,請仔細閱讀聯機文檔。
感謝 Simon Tatham 的淳淳教誨,接下來咱們能夠 hack 一下源碼了。先來看看實現 protothreads 的數據結構, 實際上它就是協程的上下文結構體,用以保存狀態變量,相信你很快就明白爲什麼它的「堆棧」只有 2 個字節:
1
2
3
|
struct
pt {
lc_t lc;
}
|
裏面只有一個 short 類型的變量,實際上它是用來保存上一次出讓點的程序計數器。這也映證了協程比線程的靈活之處,就是協程能夠是 stackless 的,若是須要實現的功能很單一,好比像生產者-消費者模型那樣用來作事件通知,那麼實際上協程須要保存的狀態變量僅僅是一個程序計數器便可。像 python generator 也是 stackless 的,固然實現一個迭代生成器可能還須要保留上一個迭代值,前面 C 的例子是用 static 變量保存,你也能夠設置成員變量添加到上下文結構體裏面。若是你真的不肯定用協程調度時須要保存多少狀態變量,那仍是用 ucontext 好了,它的上下文提供了堆棧和信號,可是由用戶負責分配資源,詳細使用方法見聯機文檔。。
1
2
3
4
5
6
|
typedef
struct
ucontext {
struct
ucontext_t *uc_link;
sigset_t uc_sigmask;
stack_t uc_stack;
...
} ucontext_t;
|
有點扯遠了,回到 protothreads,看看提供的協程「原語」。有兩種實現方法,在 ANSI C 下,就是傳統的 switch-case 語句:
1
2
3
4
|
#define LC_INIT(s) s = 0; // 源碼中是有分號的,一個低級 bug,啊哈~
#define LC_RESUME(s) switch (s) { case 0:
#define LC_SET(s) s = __LINE__; case __LINE__:
#define LC_END(s) }
|
但這種「原語」有個難以察覺的缺陷:就是你沒法在 LC_RESUME 和 LC_END (或者包含它們的組件)之間的代碼中使用 switch-case語句,由於這會引發外圍的 switch 跳轉錯誤!爲此,protothreads 又實現了基於 GNU C 的調度「原語」。在 GNU C 下還有一種語法糖叫作標籤指針,就是在一個 label 前面加 &&(不是地址的地址,是 GNU 自定義的符號),能夠用 void 指針類型保存,而後 goto 跳轉:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
|
typedef
void
* lc_t;
#define LC_INIT(s) s = NULL
#define LC_RESUME(s) \
do
{ \
if
(s != NULL) { \
goto
*s; \
}
}
while
(0)
#define LC_CONCAT2(s1, s2) s1##s2
#define LC_CONCAT(s1, s2) LC_CONCAT2(s1, s2)
#define LC_SET(s) \
do
{ \
LC_CONCAT(LC_LABEL, __LINE__): \
(s) = &&LC_CONCAT(LC_LABEL, __LINE__); \
}
while
(0)
|
好了,有了前面的基礎知識,理解這些「原語」就是小菜一疊,下面看看如何創建「組件」,同時也是 protothreads API,咱們先定義四個退出碼做爲協程的調度狀態機:
1
2
3
4
|
#define PT_WAITING 0
#define PT_YIELDED 1
#define PT_EXITED 2
#define PT_ENDED 3
|
下面這些 API 可直接在應用程序中調用:
/* 初始化一個協程,也即初始化狀態變量 */ #define PT_INIT(pt) LC_INIT((pt)->lc) /* 聲明一個函數,返回值爲 char 即退出碼,表示函數體內使用了 proto thread,(我的以爲有些畫蛇添足) */ #define PT_THREAD(name_args) char name_args /* 協程入口點, PT_YIELD_FLAG=0表示出讓,=1表示不出讓,放在 switch 語句前面,下次調用的時候能夠跳轉到上次出讓點繼續執行 */ #define PT_BEGIN(pt) { char PT_YIELD_FLAG = 1; LC_RESUME((pt)->lc) /* 協程退出點,至此一個協程算是終止了,清空全部上下文和標誌 */ #define PT_END(pt) LC_END((pt)->lc); PT_YIELD_FLAG = 0; \ PT_INIT(pt); return PT_ENDED; } /* 協程出讓點,若是此時協程狀態變量 lc 已經變爲 __LINE__ 跳轉過來的,那麼 PT_YIELD_FLAG = 1,表示從出讓點繼續執行。 */ #define PT_YIELD(pt) \ do { \ PT_YIELD_FLAG = 0; \ LC_SET((pt)->lc); \ if(PT_YIELD_FLAG == 0) { \ return PT_YIELDED; \ } \ } while(0) /* 附加出讓條件 */ #define PT_YIELD_UNTIL(pt, cond) \ do { \ PT_YIELD_FLAG = 0; \ LC_SET((pt)->lc); \ if((PT_YIELD_FLAG == 0) || !(cond)) { \ return PT_YIELDED; \ } \ } while(0) /* 協程阻塞點(blocking),本質上等同於 PT_YIELD_UNTIL,只不過退出碼是 PT_WAITING,用來模擬信號量同步 */ #define PT_WAIT_UNTIL(pt, condition) \ do { \ LC_SET((pt)->lc); \ if(!(condition)) { \ return PT_WAITING; \ } \ } while(0) /* 同 PT_WAIT_UNTIL 條件反轉 */ #define PT_WAIT_WHILE(pt, cond) PT_WAIT_UNTIL((pt), !(cond)) /* 協程調度,調用協程 f 並檢查它的退出碼,直到協程終止返回 0,不然返回 1。 */ #define PT_SCHEDULE(f) ((f) < PT_EXITED) /* 這用於非對稱協程,調用者是主協程,pt 是和子協程 thread (能夠是多個)關聯的上下文句柄,主協程阻塞本身調度子協程,直到全部子協程終止 */ #define PT_WAIT_THREAD(pt, thread) PT_WAIT_WHILE((pt), PT_SCHEDULE(thread)) /* 用於協程嵌套調度,child 是子協程的上下文句柄 */ #define PT_SPAWN(pt, child, thread) \ do { \ PT_INIT((child)); \ PT_WAIT_THREAD((pt), (thread)); \ } while(0)
暫時介紹這麼多,用戶還能夠根據本身的需求隨意擴展組件,好比實現信號量,你會發現脫離了操做系統環境下的信號量竟是如此簡單:
1
2
3
4
5
6
7
8
9
10
11
12
13
|
struct
pt_sem {
unsigned
int
count;
};
#define PT_SEM_INIT(s, c) (s)->count = c
#define PT_SEM_WAIT(pt, s) \
do
{ \
PT_WAIT_UNTIL(pt, (s)->count > 0); \
--(s)->count; \
}
while
(0)
#define PT_SEM_SIGNAL(pt, s) ++(s)->count
|
這些應該不須要我多說了吧,呵呵,讓咱們回到最初例舉的生產者-消費者模型,看看protothreads表現怎樣。
#include "pt-sem.h" #define NUM_ITEMS 32 #define BUFSIZE 8 static struct pt_sem mutex, full, empty; PT_THREAD(producer(struct pt *pt)) { static int produced; PT_BEGIN(pt); for (produced = 0; produced < NUM_ITEMS; ++produced) { PT_SEM_WAIT(pt, &full); PT_SEM_WAIT(pt, &mutex); add_to_buffer(produce_item()); PT_SEM_SIGNAL(pt, &mutex); PT_SEM_SIGNAL(pt, &empty); } PT_END(pt); } PT_THREAD(consumer(struct pt *pt)) { static int consumed; PT_BEGIN(pt); for (consumed = 0; consumed < NUM_ITEMS; ++consumed) { PT_SEM_WAIT(pt, &empty); PT_SEM_WAIT(pt, &mutex); consume_item(get_from_buffer()); PT_SEM_SIGNAL(pt, &mutex); PT_SEM_SIGNAL(pt, &full); } PT_END(pt); } PT_THREAD(driver_thread(struct pt *pt)) { static struct pt pt_producer, pt_consumer; PT_BEGIN(pt); PT_SEM_INIT(&empty, 0); PT_SEM_INIT(&full, BUFSIZE); PT_SEM_INIT(&mutex, 1); PT_INIT(&pt_producer); PT_INIT(&pt_consumer); PT_WAIT_THREAD(pt, producer(&pt_producer) & consumer(&pt_consumer)); PT_END(pt); }
源碼包中的 example-buffer.c 包含了可運行的完整示例,我就不所有貼了。總體框架就是一個 asymmetric coroutines,包括一個主協程 driver_thread 和兩個子協程 producer 和 consumer ,其實不用多說你們也懂的,代碼很是清晰直觀。咱們徹底能夠經過單線程實現一個簡單的事件處理需求,你能夠任意添加數十萬個協程,幾乎不會引發任何額外的系統開銷和資源佔用。惟一須要留意的地方就是沒有一個局部變量,由於 protothreads 是 stackless 的,但這不是問題,首先咱們已經假定運行環境是單線程的,其次在一個簡化的需求下也用不了多少「局部變量」。若是在協程出讓時須要保存一些額外的狀態量,像迭代生成器,只要數目和大小都是肯定而且可控的話,自行擴展協程上下文結構體便可。
固然這不是說 protothreads 是萬能的,它只是貢獻了一種模型,你要使用它首先就得學會適應它。下面列舉一些 protothreads 的使用限制:
官網上還例舉了更多實例,都很是實用。另外,一個叫 Craig Graham 的工程師擴展了 pt.h,使得 protothreads 支持 sleep/wake/kill 等操做,文件在此 graham-pt.h。
看到這裏,手養的你是否想火燒眉毛地 DIY 一個協程組件呢?哪怕不少動態語言自己已經支持了協程語義,不少 C 程序員仍然傾向於本身實現組件,網上不少開源代碼底層用的主要仍是 glibc 的 ucontext 組件,畢竟提供堆棧的協程組件使用起來更加通用方便。你能夠本身寫一個調度器,而後模擬線程上下文,再而後……你就能搞出一個跨平臺的COS了(笑)。GNU Pth 線程庫就是這麼實現的,其原做者德國人 Ralf S. Engelschall (又是個開源大牛,還寫了 OpenSSL 等許多做品)就寫了一篇論文教你們如何實現一個線程庫。另外 protothreads 官網上也有一大堆推薦閱讀。Have fun!
(全文完)轉自:http://coolshell.cn/articles/10975.html