什麼是 Event Loop？

時間 2019-11-13

標籤什麼 event loop 简体版

原文原文鏈接

Event Loop 是一個很重要的概念，指的是計算機系統的一種運行機制。javascript

JavaScript語言就採用這種機制，來解決單線程運行帶來的一些問題。html

本文參考C. Aaron Cois的《Understanding The Node.js Event Loop》，解釋什麼是Event Loop，以及它與JavaScript語言的單線程模型有何關係。java

想要理解Event Loop，就要從程序的運行模式講起。運行之後的程序叫作"進程"（process），通常狀況下，一個進程一次只能執行一個任務。node

若是有不少任務須要執行，不外乎三種解決方法。git

（1）排隊。由於一個進程一次只能執行一個任務，只好等前面的任務執行完了，再執行後面的任務。github

（2）新建進程。使用fork命令，爲每一個任務新建一個進程。vim

（3）新建線程。由於進程太耗費資源，因此現在的程序每每容許一個進程包含多個線程，由線程去完成任務。（進程和線程的詳細解釋，請看這裏。）api

以JavaScript語言爲例，它是一種單線程語言，全部任務都在一個線程上完成，即採用上面的第一種方法。一旦遇到大量任務或者遇到一個耗時的任務，網頁就會出現"假死"，由於JavaScript停不下來，也就沒法響應用戶的行爲。瀏覽器

你也許會問，JavaScript爲何是單線程，難道不能實現爲多線程嗎？服務器

這跟歷史有關係。JavaScript從誕生起就是單線程。緣由大概是不想讓瀏覽器變得太複雜，由於多線程須要共享資源、且有可能修改彼此的運行結果，對於一種網頁腳本語言來講，這就太複雜了。後來就約定俗成，JavaScript爲一種單線程語言。（Worker API能夠實現多線程，可是JavaScript自己始終是單線程的。）

若是某個任務很耗時，好比涉及不少I/O（輸入/輸出）操做，那麼線程的運行大概是下面的樣子。

上圖的綠色部分是程序的運行時間，紅色部分是等待時間。能夠看到，因爲I/O操做很慢，因此這個線程的大部分運行時間都在空等I/O操做的返回結果。這種運行方式稱爲"同步模式"（synchronous I/O）或"堵塞模式"（blocking I/O）。

若是採用多線程，同時運行多個任務，那極可能就是下面這樣。

上圖代表，多線程不只佔用多倍的系統資源，也閒置多倍的資源，這顯然不合理。

Event Loop就是爲了解決這個問題而提出的。Wikipedia這樣定義：

"Event Loop是一個程序結構，用於等待和發送消息和事件。（a programming construct that waits for and dispatches events or messages in a program.）"

簡單說，就是在程序中設置兩個線程：一個負責程序自己的運行，稱爲"主線程"；另外一個負責主線程與其餘進程（主要是各類I/O操做）的通訊，被稱爲"Event Loop線程"（能夠譯爲"消息線程"）。

上圖主線程的綠色部分，仍是表示運行時間，而橙色部分表示空閒時間。每當遇到I/O的時候，主線程就讓Event Loop線程去通知相應的I/O程序，而後接着日後運行，因此不存在紅色的等待時間。等到I/O程序完成操做，Event Loop線程再把結果返回主線程。主線程就調用事先設定的回調函數，完成整個任務。

能夠看到，因爲多出了橙色的空閒時間，因此主線程得以運行更多的任務，這就提升了效率。這種運行方式稱爲"異步模式"（asynchronous I/O）或"非堵塞模式"（non-blocking mode）。

這正是JavaScript語言的運行方式。單線程模型雖然對JavaScript構成了很大的限制，但也所以使它具有了其餘語言不具有的優點。若是部署得好，JavaScript程序是不會出現堵塞的，這就是爲何node.js平臺能夠用不多的資源，應付大流量訪問的緣由。

（完）

1、爲何JavaScript是單線程？

JavaScript語言的一大特色就是單線程，也就是說，同一個時間只能作一件事。那麼，爲何JavaScript不能有多個線程呢？這樣能提升效率啊。

JavaScript的單線程，與它的用途有關。做爲瀏覽器腳本語言，JavaScript的主要用途是與用戶互動，以及操做DOM。這決定了它只能是單線程，不然會帶來很複雜的同步問題。好比，假定JavaScript同時有兩個線程，一個線程在某個DOM節點上添加內容，另外一個線程刪除了這個節點，這時瀏覽器應該以哪一個線程爲準？

因此，爲了不復雜性，從一誕生，JavaScript就是單線程，這已經成了這門語言的核心特徵，未來也不會改變。

爲了利用多核CPU的計算能力，HTML5提出Web Worker標準，容許JavaScript腳本建立多個線程，可是子線程徹底受主線程控制，且不得操做DOM。因此，這個新標準並無改變JavaScript單線程的本質。

2、任務隊列

單線程就意味着，全部任務須要排隊，前一個任務結束，纔會執行後一個任務。若是前一個任務耗時很長，後一個任務就不得不一直等着。

若是排隊是由於計算量大，CPU忙不過來，倒也算了，可是不少時候CPU是閒着的，由於IO設備（輸入輸出設備）很慢（好比Ajax操做從網絡讀取數據），不得不等着結果出來，再往下執行。

JavaScript語言的設計者意識到，這時主線程徹底能夠無論IO設備，掛起處於等待中的任務，先運行排在後面的任務。等到IO設備返回告終果，再回過頭，把掛起的任務繼續執行下去。

因而，全部任務能夠分紅兩種，一種是同步任務（synchronous），另外一種是異步任務（asynchronous）。同步任務指的是，在主線程上排隊執行的任務，只有前一個任務執行完畢，才能執行後一個任務；異步任務指的是，不進入主線程、而進入"任務隊列"（task queue）的任務，只有"任務隊列"通知主線程，某個異步任務能夠執行了，該任務纔會進入主線程執行。

具體來講，異步執行的運行機制以下。（同步執行也是如此，由於它能夠被視爲沒有異步任務的異步執行。）

（1）全部同步任務都在主線程上執行，造成一個執行棧（execution context stack）。

（2）主線程以外，還存在一個"任務隊列"（task queue）。只要異步任務有了運行結果，就在"任務隊列"之中放置一個事件。

（3）一旦"執行棧"中的全部同步任務執行完畢，系統就會讀取"任務隊列"，看看裏面有哪些事件。那些對應的異步任務，因而結束等待狀態，進入執行棧，開始執行。

（4）主線程不斷重複上面的第三步。

下圖就是主線程和任務隊列的示意圖。

只要主線程空了，就會去讀取"任務隊列"，這就是JavaScript的運行機制。這個過程會不斷重複。

3、事件和回調函數

"任務隊列"是一個事件的隊列（也能夠理解成消息的隊列），IO設備完成一項任務，就在"任務隊列"中添加一個事件，表示相關的異步任務能夠進入"執行棧"了。主線程讀取"任務隊列"，就是讀取裏面有哪些事件。

"任務隊列"中的事件，除了IO設備的事件之外，還包括一些用戶產生的事件（好比鼠標點擊、頁面滾動等等）。只要指定過回調函數，這些事件發生時就會進入"任務隊列"，等待主線程讀取。

所謂"回調函數"（callback），就是那些會被主線程掛起來的代碼。異步任務必須指定回調函數，當主線程開始執行異步任務，就是執行對應的回調函數。

"任務隊列"是一個先進先出的數據結構，排在前面的事件，優先被主線程讀取。主線程的讀取過程基本上是自動的，只要執行棧一清空，"任務隊列"上第一位的事件就自動進入主線程。可是，因爲存在後文提到的"定時器"功能，主線程首先要檢查一下執行時間，某些事件只有到了規定的時間，才能返回主線程。

4、Event Loop

主線程從"任務隊列"中讀取事件，這個過程是循環不斷的，因此整個的這種運行機制又稱爲Event Loop（事件循環）。

爲了更好地理解Event Loop，請看下圖（轉引自Philip Roberts的演講《Help, I'm stuck in an event-loop》）。

上圖中，主線程運行的時候，產生堆（heap）和棧（stack），棧中的代碼調用各類外部API，它們在"任務隊列"中加入各類事件（click，load，done）。只要棧中的代碼執行完畢，主線程就會去讀取"任務隊列"，依次執行那些事件所對應的回調函數。

執行棧中的代碼（同步任務），老是在讀取"任務隊列"（異步任務）以前執行。請看下面這個例子。

var req = new XMLHttpRequest(); req.open('GET', url); req.onload = function (){}; req.onerror = function (){}; req.send();

上面代碼中的req.send方法是Ajax操做向服務器發送數據，它是一個異步任務，意味着只有當前腳本的全部代碼執行完，系統纔會去讀取"任務隊列"。因此，它與下面的寫法等價。

var req = new XMLHttpRequest(); req.open('GET', url); req.send(); req.onload = function (){}; req.onerror = function (){};

也就是說，指定回調函數的部分（onload和onerror），在send()方法的前面或後面可有可無，由於它們屬於執行棧的一部分，系統老是執行完它們，纔會去讀取"任務隊列"。

5、定時器

除了放置異步任務的事件，"任務隊列"還能夠放置定時事件，即指定某些代碼在多少時間以後執行。這叫作"定時器"（timer）功能，也就是定時執行的代碼。

定時器功能主要由setTimeout()和setInterval()這兩個函數來完成，它們的內部運行機制徹底同樣，區別在於前者指定的代碼是一次性執行，後者則爲反覆執行。如下主要討論setTimeout()。

setTimeout()接受兩個參數，第一個是回調函數，第二個是推遲執行的毫秒數。

console.log(1); setTimeout(function(){console.log(2);},1000); console.log(3);

上面代碼的執行結果是1，3，2，由於setTimeout()將第二行推遲到1000毫秒以後執行。

若是將setTimeout()的第二個參數設爲0，就表示當前代碼執行完（執行棧清空）之後，當即執行（0毫秒間隔）指定的回調函數。

setTimeout(function(){console.log(1);}, 0); console.log(2);

上面代碼的執行結果老是2，1，由於只有在執行完第二行之後，系統纔會去執行"任務隊列"中的回調函數。

總之，setTimeout(fn,0)的含義是，指定某個任務在主線程最先可得的空閒時間執行，也就是說，儘量早得執行。它在"任務隊列"的尾部添加一個事件，所以要等到同步任務和"任務隊列"現有的事件都處理完，纔會獲得執行。

HTML5標準規定了setTimeout()的第二個參數的最小值（最短間隔），不得低於4毫秒，若是低於這個值，就會自動增長。在此以前，老版本的瀏覽器都將最短間隔設爲10毫秒。另外，對於那些DOM的變更（尤爲是涉及頁面從新渲染的部分），一般不會當即執行，而是每16毫秒執行一次。這時使用requestAnimationFrame()的效果要好於setTimeout()。

須要注意的是，setTimeout()只是將事件插入了"任務隊列"，必須等到當前代碼（執行棧）執行完，主線程纔會去執行它指定的回調函數。要是當前代碼耗時很長，有可能要等好久，因此並無辦法保證，回調函數必定會在setTimeout()指定的時間執行。

6、Node.js的Event Loop

Node.js也是單線程的Event Loop，可是它的運行機制不一樣於瀏覽器環境。

請看下面的示意圖（做者@BusyRich）。

根據上圖，Node.js的運行機制以下。

（1）V8引擎解析JavaScript腳本。

（2）解析後的代碼，調用Node API。

（3）libuv庫負責Node API的執行。它將不一樣的任務分配給不一樣的線程，造成一個Event Loop（事件循環），以異步的方式將任務的執行結果返回給V8引擎。

（4）V8引擎再將結果返回給用戶。

除了setTimeout和setInterval這兩個方法，Node.js還提供了另外兩個與"任務隊列"有關的方法：process.nextTick和setImmediate。它們能夠幫助咱們加深對"任務隊列"的理解。

process.nextTick方法能夠在當前"執行棧"的尾部----下一次Event Loop（主線程讀取"任務隊列"）以前----觸發回調函數。也就是說，它指定的任務老是發生在全部異步任務以前。setImmediate方法則是在當前"任務隊列"的尾部添加事件，也就是說，它指定的任務老是在下一次Event Loop時執行，這與setTimeout(fn, 0)很像。請看下面的例子（via StackOverflow）。

process.nextTick(function A() { console.log(1); process.nextTick(function B(){console.log(2);}); }); setTimeout(function timeout() { console.log('TIMEOUT FIRED'); }, 0) // 1 // 2 // TIMEOUT FIRED

上面代碼中，因爲process.nextTick方法指定的回調函數，老是在當前"執行棧"的尾部觸發，因此不只函數A比setTimeout指定的回調函數timeout先執行，並且函數B也比timeout先執行。這說明，若是有多個process.nextTick語句（無論它們是否嵌套），將所有在當前"執行棧"執行。

如今，再看setImmediate。

setImmediate(function A() { console.log(1); setImmediate(function B(){console.log(2);}); }); setTimeout(function timeout() { console.log('TIMEOUT FIRED'); }, 0);

上面代碼中，setImmediate與setTimeout(fn,0)各自添加了一個回調函數A和timeout，都是在下一次Event Loop觸發。那麼，哪一個回調函數先執行呢？答案是不肯定。運行結果多是1--TIMEOUT FIRED--2，也多是TIMEOUT FIRED--1--2。

使人困惑的是，Node.js文檔中稱，setImmediate指定的回調函數，老是排在setTimeout前面。實際上，這種狀況只發生在遞歸調用的時候。

setImmediate(function (){ setImmediate(function A() { console.log(1); setImmediate(function B(){console.log(2);}); }); setTimeout(function timeout() { console.log('TIMEOUT FIRED'); }, 0); }); // 1 // TIMEOUT FIRED // 2

上面代碼中，setImmediate和setTimeout被封裝在一個setImmediate裏面，它的運行結果老是1--TIMEOUT FIRED--2，這時函數A必定在timeout前面觸發。至於2排在TIMEOUT FIRED的後面（即函數B在timeout後面觸發），是由於setImmediate老是將事件註冊到下一輪Event Loop，因此函數A和timeout是在同一輪Loop執行，而函數B在下一輪Loop執行。

咱們由此獲得了process.nextTick和setImmediate的一個重要區別：多個process.nextTick語句老是在當前"執行棧"一次執行完，多個setImmediate可能則須要屢次loop才能執行完。事實上，這正是Node.js 10.0版添加setImmediate方法的緣由，不然像下面這樣的遞歸調用process.nextTick，將會沒完沒了，主線程根本不會去讀取"事件隊列"！

process.nextTick(function foo() { process.nextTick(foo); });

事實上，如今要是你寫出遞歸的process.nextTick，Node.js會拋出一個警告，要求你改爲setImmediate。

另外，因爲process.nextTick指定的回調函數是在本次"事件循環"觸發，而setImmediate指定的是在下次"事件循環"觸發，因此很顯然，前者老是比後者發生得早，並且執行效率也高（由於不用檢查"任務隊列"）。

（完）

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。