上個月,我偶然看到了Philip Roberts的演講《Help, I'm stuck in an event-loop》。javascript
進入正文以前,插播一條消息。個人新書《ECMAScript 6入門》出版了(版權頁,內頁1,內頁2),銅版紙全綵印刷,很是精美,還附有索引(固然價格也比同類書籍略貴一點點)。預覽和購買點擊這裏。html
(2014年10月13日更新:本文已經作了較大修改,反映了我如今的認識。關於setTimeout的更多解釋和示例,請參閱我正在寫的《JavaScript標準參考教程》。)java
(2014年10月11日更新:樸靈老師對本文作了評註,詳細得指出了文中存在的錯誤說法,建議閱讀。)node
JavaScript語言的一大特色就是單線程,也就是說,同一個時間只能作一件事。那麼,爲何JavaScript不能有多個線程呢?這樣能提升效率啊。es6
JavaScript的單線程,與它的用途有關。做爲瀏覽器腳本語言,JavaScript的主要用途是與用戶互動,以及操做DOM。這決定了它只能是單線程,不然會帶來很複雜的同步問題。好比,假定JavaScript同時有兩個線程,一個線程在某個DOM節點上添加內容,另外一個線程刪除了這個節點,這時瀏覽器應該以哪一個線程爲準?vim
因此,爲了不復雜性,從一誕生,JavaScript就是單線程,這已經成了這門語言的核心特徵,未來也不會改變。api
爲了利用多核CPU的計算能力,HTML5提出Web Worker標準,容許JavaScript腳本建立多個線程,可是子線程徹底受主線程控制,且不得操做DOM。因此,這個新標準並無改變JavaScript單線程的本質。瀏覽器
單線程就意味着,全部任務須要排隊,前一個任務結束,纔會執行後一個任務。若是前一個任務耗時很長,後一個任務就不得不一直等着。服務器
若是排隊是由於計算量大,CPU忙不過來,倒也算了,可是不少時候CPU是閒着的,由於IO設備(輸入輸出設備)很慢(好比Ajax操做從網絡讀取數據),不得不等着結果出來,再往下執行。網絡
JavaScript語言的設計者意識到,這時主線程徹底能夠無論IO設備,掛起處於等待中的任務,先運行排在後面的任務。等到IO設備返回告終果,再回過頭,把掛起的任務繼續執行下去。
因而,全部任務能夠分紅兩種,一種是同步任務(synchronous),另外一種是異步任務(asynchronous)。同步任務指的是,在主線程上排隊執行的任務,只有前一個任務執行完畢,才能執行後一個任務;異步任務指的是,不進入主線程、而進入"任務隊列"(task queue)的任務,只有"任務隊列"通知主線程,某個異步任務能夠執行了,該任務纔會進入主線程執行。
具體來講,異步執行的運行機制以下。(同步執行也是如此,由於它能夠被視爲沒有異步任務的異步執行。)
(1)全部同步任務都在主線程上執行,造成一個執行棧(execution context stack)。
(2)主線程以外,還存在一個"任務隊列"(task queue)。只要異步任務有了運行結果,就在"任務隊列"之中放置一個事件。
(3)一旦"執行棧"中的全部同步任務執行完畢,系統就會讀取"任務隊列",看看裏面有哪些事件。那些對應的異步任務,因而結束等待狀態,進入執行棧,開始執行。
(4)主線程不斷重複上面的第三步。
下圖就是主線程和任務隊列的示意圖。
只要主線程空了,就會去讀取"任務隊列",這就是JavaScript的運行機制。這個過程會不斷重複。
"任務隊列"是一個事件的隊列(也能夠理解成消息的隊列),IO設備完成一項任務,就在"任務隊列"中添加一個事件,表示相關的異步任務能夠進入"執行棧"了。主線程讀取"任務隊列",就是讀取裏面有哪些事件。
"任務隊列"中的事件,除了IO設備的事件之外,還包括一些用戶產生的事件(好比鼠標點擊、頁面滾動等等)。只要指定過回調函數,這些事件發生時就會進入"任務隊列",等待主線程讀取。
所謂"回調函數"(callback),就是那些會被主線程掛起來的代碼。異步任務必須指定回調函數,當主線程開始執行異步任務,就是執行對應的回調函數。
"任務隊列"是一個先進先出的數據結構,排在前面的事件,優先被主線程讀取。主線程的讀取過程基本上是自動的,只要執行棧一清空,"任務隊列"上第一位的事件就自動進入主線程。可是,因爲存在後文提到的"定時器"功能,主線程首先要檢查一下執行時間,某些事件只有到了規定的時間,才能返回主線程。
主線程從"任務隊列"中讀取事件,這個過程是循環不斷的,因此整個的這種運行機制又稱爲Event Loop(事件循環)。
爲了更好地理解Event Loop,請看下圖(轉引自Philip Roberts的演講《Help, I'm stuck in an event-loop》)。
上圖中,主線程運行的時候,產生堆(heap)和棧(stack),棧中的代碼調用各類外部API,它們在"任務隊列"中加入各類事件(click,load,done)。只要棧中的代碼執行完畢,主線程就會去讀取"任務隊列",依次執行那些事件所對應的回調函數。
執行棧中的代碼(同步任務),老是在讀取"任務隊列"(異步任務)以前執行。請看下面這個例子。
var req = new XMLHttpRequest(); req.open('GET', url); req.onload = function (){}; req.onerror = function (){}; req.send();
上面代碼中的req.send方法是Ajax操做向服務器發送數據,它是一個異步任務,意味着只有當前腳本的全部代碼執行完,系統纔會去讀取"任務隊列"。因此,它與下面的寫法等價。
var req = new XMLHttpRequest(); req.open('GET', url); req.send(); req.onload = function (){}; req.onerror = function (){};
也就是說,指定回調函數的部分(onload和onerror),在send()方法的前面或後面可有可無,由於它們屬於執行棧的一部分,系統老是執行完它們,纔會去讀取"任務隊列"。
除了放置異步任務的事件,"任務隊列"還能夠放置定時事件,即指定某些代碼在多少時間以後執行。這叫作"定時器"(timer)功能,也就是定時執行的代碼。
定時器功能主要由setTimeout()和setInterval()這兩個函數來完成,它們的內部運行機制徹底同樣,區別在於前者指定的代碼是一次性執行,後者則爲反覆執行。如下主要討論setTimeout()。
setTimeout()接受兩個參數,第一個是回調函數,第二個是推遲執行的毫秒數。
console.log(1); setTimeout(function(){console.log(2);},1000); console.log(3);
上面代碼的執行結果是1,3,2,由於setTimeout()將第二行推遲到1000毫秒以後執行。
若是將 setTimeout() 的第二個參數設爲0,就表示當前代碼執行完(執行棧清空)之後,當即執行(0毫秒間隔)指定的回調函數。
setTimeout(function(){console.log(1);}, 0); console.log(2);
上面代碼的執行結果老是2,1,由於只有在執行完第二行之後,系統纔會去執行"任務隊列"中的回調函數。
總之, setTimeout(fn,0) 的含義是,指定某個任務在主線程最先可得的空閒時間執行,也就是說,儘量早得執行。它在"任務隊列"的尾部添加一個事件,所以要等到同步任務和"任務隊列"現有的事件都處理完,纔會獲得執行。
HTML5標準規定了 setTimeout() 的第二個參數的最小值(最短間隔),不得低於4毫秒,若是低於這個值,就會自動增長。在此以前,老版本的瀏覽器都將最短間隔設爲10毫秒。另外,對於那些DOM的變更(尤爲是涉及頁面從新渲染的部分),一般不會當即執行,而是每16毫秒執行一次。這時使用 requestAnimationFrame() 的效果要好於 setTimeout() 。
須要注意的是, setTimeout() 只是將事件插入了"任務隊列",必須等到當前代碼(執行棧)執行完,主線程纔會去執行它指定的回調函數。要是當前代碼耗時很長,有可能要等好久,因此並無辦法保證,回調函數必定會在 setTimeout() 指定的時間執行。
Node.js也是單線程的Event Loop,可是它的運行機制不一樣於瀏覽器環境。
請看下面的示意圖(做者@BusyRich)。
根據上圖,Node.js的運行機制以下。
(1)V8引擎解析JavaScript腳本。
(2)解析後的代碼,調用Node API。
(3)libuv庫負責Node API的執行。它將不一樣的任務分配給不一樣的線程,造成一個Event Loop(事件循環),以異步的方式將任務的執行結果返回給V8引擎。
(4)V8引擎再將結果返回給用戶。
除了 setTimeout 和 setInterval 這兩個方法,Node.js還提供了另外兩個與"任務隊列"有關的方法:process.nextTick和setImmediate。它們能夠幫助咱們加深對"任務隊列"的理解。
process.nextTick 方法能夠在當前"執行棧"的尾部----下一次 Event Loop (主線程讀取"任務隊列")以前----觸發回調函數。也就是說,它指定的任務老是發生在全部異步任務以前。 setImmediate 方法則是在當前"任務隊列"的尾部添加事件,也就是說,它指定的任務老是在下一次 Event Loop 時執行,這與 setTimeout(fn, 0) 很像。請看下面的例子(via StackOverflow)。
process.nextTick(function A() { console.log(1); process.nextTick(function B(){console.log(2);}); }); setTimeout(function timeout() { console.log('TIMEOUT FIRED'); }, 0) // 1 // 2 // TIMEOUT FIRED
上面代碼中,因爲 process.nextTick 方法指定的回調函數,老是在當前"執行棧"的尾部觸發,因此不只函數A比 setTimeout 指定的回調函數 timeout 先執行,並且函數B也比 timeout 先執行。這說明,若是有多個 process.nextTick 語句(無論它們是否嵌套),將所有在當前"執行棧"執行。
如今,再看setImmediate。
setImmediate(function A() { console.log(1); setImmediate(function B(){console.log(2);}); }); setTimeout(function timeout() { console.log('TIMEOUT FIRED'); }, 0);
上面代碼中, setImmediate 與 setTimeout(fn,0) 各自添加了一個回調函數A和 timeout ,都是在下一次 Event Loop 觸發。那麼,哪一個回調函數先執行呢?答案是不肯定。運行結果多是 1--TIMEOUT FIRED--2 ,也多是 TIMEOUT FIRED--1--2 。
使人困惑的是,Node.js文檔中稱, setImmediate 指定的回調函數,老是排在 setTimeout 前面。實際上,這種狀況只發生在遞歸調用的時候。
setImmediate(function (){ setImmediate(function A() { console.log(1); setImmediate(function B(){console.log(2);}); }); setTimeout(function timeout() { console.log('TIMEOUT FIRED'); }, 0); }); // 1 // TIMEOUT FIRED // 2
上面代碼中, setImmediate 和 setTimeout 被封裝在一個 setImmediate 裏面,它的運行結果老是 1--TIMEOUT FIRED--2 ,這時函數A必定在 timeout 前面觸發。至於2排在 TIMEOUT FIRED 的後面(即函數B在 timeout 後面觸發),是由於 setImmediate 老是將事件註冊到下一輪 Event Loop ,因此函數A和 timeout 是在同一輪Loop執行,而函數B在下一輪Loop執行。
咱們由此獲得了 process.nextTick 和 setImmediate 的一個重要區別:多個 process.nextTick 語句老是在當前"執行棧"一次執行完,多個 setImmediate 可能則須要屢次 loop 才能執行完。事實上,這正是Node.js 10.0版添加 setImmediate 方法的緣由,不然像下面這樣的遞歸調用 process.nextTick ,將會沒完沒了,主線程根本不會去讀取"事件隊列"!
process.nextTick(function foo() { process.nextTick(foo); });
事實上,如今要是你寫出遞歸的 process.nextTick ,Node.js會拋出一個警告,要求你改爲 setImmediate 。
另外,因爲 process.nextTick 指定的回調函數是在本次"事件循環"觸發,而 setImmediate 指定的是在下次"事件循環"觸發,因此很顯然,前者老是比後者發生得早,並且執行效率也高(由於不用檢查"任務隊列")。(完)