es6異步操做

異步編程對 JavaScript 語言過重要。JavaScript 只有一根線程,若是沒有異步編程,根本無法用,非卡死不可。node

ES6 誕生之前,異步編程的方法,大概有下面四種。git

  • 回調函數
  • 事件監聽
  • 發佈/訂閱
  • Promise 對象

ES6 將 JavaScript 異步編程帶入了一個全新的階段。github

基本概念

異步

所謂"異步",簡單說就是一個任務分紅兩段,先執行第一段,而後轉而執行其餘任務,等作好了準備,再回過頭執行第二段。shell

好比,有一個任務是讀取文件進行處理,任務的第一段是向操做系統發出請求,要求讀取文件。而後,程序執行其餘任務,等到操做系統返回文件,再接着執行任務的第二段(處理文件)。這種不連續的執行,就叫作異步。npm

相應地,連續的執行就叫作同步。因爲是連續執行,不能插入其餘任務,因此操做系統從硬盤讀取文件的這段時間,程序只能乾等着。編程

回調函數

JavaScript語言對異步編程的實現,就是回調函數。所謂回調函數,就是把任務的第二段單獨寫在一個函數裏面,等到從新執行這個任務的時候,就直接調用這個函數。它的英語名字callback,直譯過來就是"從新調用"。json

讀取文件進行處理,是這樣寫的。api

fs.readFile('/etc/passwd', function (err, data) {
  if (err) throw err;
  console.log(data);
});

上面代碼中,readFile函數的第二個參數,就是回調函數,也就是任務的第二段。等到操做系統返回了/etc/passwd這個文件之後,回調函數纔會執行。數組

一個有趣的問題是,爲何Node.js約定,回調函數的第一個參數,必須是錯誤對象err(若是沒有錯誤,該參數就是null)?緣由是執行分紅兩段,在這兩段之間拋出的錯誤,程序沒法捕捉,只能看成參數,傳入第二段。promise

Promise

回調函數自己並無問題,它的問題出如今多個回調函數嵌套。假定讀取A文件以後,再讀取B文件,代碼以下。

fs.readFile(fileA, function (err, data) {
  fs.readFile(fileB, function (err, data) {
    // ...
  });
});

不難想象,若是依次讀取多個文件,就會出現多重嵌套。代碼不是縱向發展,而是橫向發展,很快就會亂成一團,沒法管理。這種狀況就稱爲「回調函數噩夢」(callback hell)。

Promise就是爲了解決這個問題而提出的。它不是新的語法功能,而是一種新的寫法,容許將回調函數的橫向加載,改爲縱向加載。採用Promise,連續讀取多個文件,寫法以下。

var readFile = require('fs-readfile-promise');

readFile(fileA)
.then(function(data){
  console.log(data.toString());
})
.then(function(){
  return readFile(fileB);
})
.then(function(data){
  console.log(data.toString());
})
.catch(function(err) {
  console.log(err);
});

上面代碼中,我使用了fs-readfile-promise模塊,它的做用就是返回一個Promise版本的readFile函數。Promise提供then方法加載回調函數,catch方法捕捉執行過程當中拋出的錯誤。

能夠看到,Promise 的寫法只是回調函數的改進,使用then方法之後,異步任務的兩段執行看得更清楚了,除此之外,並沒有新意。

Promise 的最大問題是代碼冗餘,原來的任務被Promise 包裝了一下,無論什麼操做,一眼看去都是一堆 then,原來的語義變得很不清楚。

那麼,有沒有更好的寫法呢?

Generator函數

協程

傳統的編程語言,早有異步編程的解決方案(實際上是多任務的解決方案)。其中有一種叫作"協程"(coroutine),意思是多個線程互相協做,完成異步任務。

協程有點像函數,又有點像線程。它的運行流程大體以下。

  • 第一步,協程A開始執行。
  • 第二步,協程A執行到一半,進入暫停,執行權轉移到協程B。
  • 第三步,(一段時間後)協程B交還執行權。
  • 第四步,協程A恢復執行。

上面流程的協程A,就是異步任務,由於它分紅兩段(或多段)執行。

舉例來講,讀取文件的協程寫法以下。

function asnycJob() {
  // ...其餘代碼
  var f = yield readFile(fileA);
  // ...其餘代碼
}

 

協程遇到 yield 命令就暫停,等到執行權返回,再從暫停的地方繼續日後執行。它的最大優勢,就是代碼的寫法很是像同步操做,若是去除yield命令,簡直如出一轍。

Generator函數的概念

Generator函數是協程在ES6的實現,最大特色就是能夠交出函數的執行權(即暫停執行)。

整個Generator函數就是一個封裝的異步任務,或者說是異步任務的容器。異步操做須要暫停的地方,都用yield語句註明。Generator函數的執行方法以下。

function* gen(x){
  var y = yield x + 2;
  return y;
}

var g = gen(1);
g.next() // { value: 3, done: false }
g.next() // { value: undefined, done: true }

上面代碼中,調用Generator函數,會返回一個內部指針(即遍歷器)g 。這是Generator函數不一樣於普通函數的另外一個地方,即執行它不會返回結果,返回的是指針對象。調用指針g的next方法,會移動內部指針(即執行異步任務的第一段),指向第一個遇到的yield語句,上例是執行到x + 2爲止。

換言之,next方法的做用是分階段執行Generator函數。每次調用next方法,會返回一個對象,表示當前階段的信息(value屬性和done屬性)。value屬性是yield語句後面表達式的值,表示當前階段的值;done屬性是一個布爾值,表示Generator函數是否執行完畢,便是否還有下一個階段。

Generator函數的數據交換和錯誤處理

Generator函數能夠暫停執行和恢復執行,這是它能封裝異步任務的根本緣由。除此以外,它還有兩個特性,使它能夠做爲異步編程的完整解決方案:函數體內外的數據交換和錯誤處理機制。

next方法返回值的value屬性,是Generator函數向外輸出數據;next方法還能夠接受參數,這是向Generator函數體內輸入數據。

function* gen(x){
  var y = yield x + 2;
  return y;
}

var g = gen(1);
g.next() // { value: 3, done: false }
g.next(2) // { value: 2, done: true }

上面代碼中,第一個next方法的value屬性,返回表達式x + 2的值(3)。第二個next方法帶有參數2,這個參數能夠傳入 Generator 函數,做爲上個階段異步任務的返回結果,被函數體內的變量y接收。所以,這一步的 value 屬性,返回的就是2(變量y的值)。

Generator 函數內部還能夠部署錯誤處理代碼,捕獲函數體外拋出的錯誤。

function* gen(x){
  try {
    var y = yield x + 2;
  } catch (e){
    console.log(e);
  }
  return y;
}

var g = gen(1);
g.next();
g.throw('出錯了');
// 出錯了

上面代碼的最後一行,Generator函數體外,使用指針對象的throw方法拋出的錯誤,能夠被函數體內的try ...catch代碼塊捕獲。這意味着,出錯的代碼與處理錯誤的代碼,實現了時間和空間上的分離,這對於異步編程無疑是很重要的。

異步任務的封裝

下面看看如何使用 Generator 函數,執行一個真實的異步任務。

var fetch = require('node-fetch');

function* gen(){
  var url = 'https://api.github.com/users/github';
  var result = yield fetch(url);
  console.log(result.bio);
}

上面代碼中,Generator函數封裝了一個異步操做,該操做先讀取一個遠程接口,而後從JSON格式的數據解析信息。就像前面說過的,這段代碼很是像同步操做,除了加上了yield命令。

執行這段代碼的方法以下。

var g = gen();
var result = g.next();

result.value.then(function(data){
  return data.json();
}).then(function(data){
  g.next(data);
});

上面代碼中,首先執行Generator函數,獲取遍歷器對象,而後使用next 方法(第二行),執行異步任務的第一階段。因爲Fetch模塊返回的是一個Promise對象,所以要用then方法調用下一個next 方法。

能夠看到,雖然 Generator 函數將異步操做表示得很簡潔,可是流程管理卻不方便(即什麼時候執行第一階段、什麼時候執行第二階段)。

Thunk函數

參數的求值策略

Thunk函數早在上個世紀60年代就誕生了。

那時,編程語言剛剛起步,計算機學家還在研究,編譯器怎麼寫比較好。一個爭論的焦點是"求值策略",即函數的參數到底應該什麼時候求值。

var x = 1;

function f(m){
  return m * 2;
}

f(x + 5)

上面代碼先定義函數f,而後向它傳入表達式x + 5。請問,這個表達式應該什麼時候求值?

一種意見是"傳值調用"(call by value),即在進入函數體以前,就計算x + 5的值(等於6),再將這個值傳入函數f 。C語言就採用這種策略。

f(x + 5)
// 傳值調用時,等同於
f(6)

另外一種意見是"傳名調用"(call by name),即直接將表達式x + 5傳入函數體,只在用到它的時候求值。Hskell語言採用這種策略。

f(x + 5)
// 傳名調用時,等同於
(x + 5) * 2

傳值調用和傳名調用,哪種比較好?回答是各有利弊。傳值調用比較簡單,可是對參數求值的時候,實際上還沒用到這個參數,有可能形成性能損失。

function f(a, b){
  return b;
}

f(3 * x * x - 2 * x - 1, x);

上面代碼中,函數f的第一個參數是一個複雜的表達式,可是函數體內根本沒用到。對這個參數求值,其實是沒必要要的。所以,有一些計算機學家傾向於"傳名調用",即只在執行時求值。

Thunk函數的含義

編譯器的"傳名調用"實現,每每是將參數放到一個臨時函數之中,再將這個臨時函數傳入函數體。這個臨時函數就叫作Thunk函數。

function f(m){
  return m * 2;
}

f(x + 5);

// 等同於

var thunk = function () {
  return x + 5;
};

function f(thunk){
  return thunk() * 2;
}

上面代碼中,函數f的參數x + 5被一個函數替換了。凡是用到原參數的地方,對Thunk函數求值便可。 這就是Thunk函數的定義,它是"傳名調用"的一種實現策略,用來替換某個表達式。

JavaScript語言的Thunk函數

JavaScript語言是傳值調用,它的Thunk函數含義有所不一樣。在JavaScript語言中,Thunk函數替換的不是表達式,而是多參數函數,將其替換成單參數的版本,且只接受回調函數做爲參數。

// 正常版本的readFile(多參數版本)
fs.readFile(fileName, callback);

// Thunk版本的readFile(單參數版本)
var readFileThunk = Thunk(fileName);
readFileThunk(callback);

var Thunk = function (fileName){
  return function (callback){
    return fs.readFile(fileName, callback);
  };
};

上面代碼中,fs模塊的readFile方法是一個多參數函數,兩個參數分別爲文件名和回調函數。通過轉換器處理,它變成了一個單參數函數,只接受回調函數做爲參數。這個單參數版本,就叫作Thunk函數。

任何函數,只要參數有回調函數,就能寫成Thunk函數的形式。下面是一個簡單的Thunk函數轉換器。

var Thunk = function(fn){
  return function (){
    var args = Array.prototype.slice.call(arguments);
    return function (callback){
      args.push(callback);
      return fn.apply(this, args);
    }
  };
};

使用上面的轉換器,生成fs.readFile的Thunk函數。

var readFileThunk = Thunk(fs.readFile);
readFileThunk(fileA)(callback);

Thunkify模塊

生產環境的轉換器,建議使用Thunkify模塊。

首先是安裝。

$ npm install thunkify

使用方式以下。

var thunkify = require('thunkify');
var fs = require('fs');

var read = thunkify(fs.readFile);
read('package.json')(function(err, str){
  // ...
});

Thunkify的源碼與上一節那個簡單的轉換器很是像。

function thunkify(fn){
  return function(){
    var args = new Array(arguments.length);
    var ctx = this;

    for(var i = 0; i < args.length; ++i) {
      args[i] = arguments[i];
    }

    return function(done){
      var called;

      args.push(function(){
        if (called) return;
        called = true;
        done.apply(null, arguments);
      });

      try {
        fn.apply(ctx, args);
      } catch (err) {
        done(err);
      }
    }
  }
};

它的源碼主要多了一個檢查機制,變量called確保回調函數只運行一次。這樣的設計與下文的Generator函數相關。請看下面的例子。

function f(a, b, callback){
  var sum = a + b;
  callback(sum);
  callback(sum);
}

var ft = thunkify(f);
ft(1, 2)(console.log);
// 3

上面代碼中,因爲thunkify只容許回調函數執行一次,因此只輸出一行結果。

Generator 函數的流程管理

你可能會問, Thunk函數有什麼用?回答是之前確實沒什麼用,可是ES6有了Generator函數,Thunk函數如今能夠用於Generator函數的自動流程管理。

以讀取文件爲例。下面的Generator函數封裝了兩個異步操做。

var fs = require('fs');
var thunkify = require('thunkify');
var readFile = thunkify(fs.readFile);

var gen = function* (){
  var r1 = yield readFile('/etc/fstab');
  console.log(r1.toString());
  var r2 = yield readFile('/etc/shells');
  console.log(r2.toString());
};

上面代碼中,yield命令用於將程序的執行權移出Generator函數,那麼就須要一種方法,將執行權再交還給Generator函數。

這種方法就是Thunk函數,由於它能夠在回調函數裏,將執行權交還給Generator函數。爲了便於理解,咱們先看如何手動執行上面這個Generator函數。

var g = gen();

var r1 = g.next();
r1.value(function(err, data){
  if (err) throw err;
  var r2 = g.next(data);
  r2.value(function(err, data){
    if (err) throw err;
    g.next(data);
  });
});

上面代碼中,變量g是Generator函數的內部指針,表示目前執行到哪一步。next方法負責將指針移動到下一步,並返回該步的信息(value屬性和done屬性)。

仔細查看上面的代碼,能夠發現Generator函數的執行過程,實際上是將同一個回調函數,反覆傳入next方法的value屬性。這使得咱們能夠用遞歸來自動完成這個過程。

Thunk函數的自動流程管理

Thunk函數真正的威力,在於能夠自動執行Generator函數。下面就是一個基於Thunk函數的Generator執行器。

function run(fn) {
  var gen = fn();

  function next(err, data) {
    var result = gen.next(data);
    if (result.done) return;
    result.value(next);
  }

  next();
}

run(gen);

上面代碼的run函數,就是一個Generator函數的自動執行器。內部的next函數就是Thunk的回調函數。next函數先將指針移到Generator函數的下一步(gen.next方法),而後判斷Generator函數是否結束(result.done 屬性),若是沒結束,就將next函數再傳入Thunk函數(result.value屬性),不然就直接退出。

有了這個執行器,執行Generator函數方便多了。無論有多少個異步操做,直接傳入run函數便可。固然,前提是每個異步操做,都要是Thunk函數,也就是說,跟在yield命令後面的必須是Thunk函數。

var gen = function* (){
  var f1 = yield readFile('fileA');
  var f2 = yield readFile('fileB');
  // ...
  var fn = yield readFile('fileN');
};

run(gen);

上面代碼中,函數gen封裝了n個異步的讀取文件操做,只要執行run函數,這些操做就會自動完成。這樣一來,異步操做不只能夠寫得像同步操做,並且一行代碼就能夠執行。

Thunk函數並非Generator函數自動執行的惟一方案。由於自動執行的關鍵是,必須有一種機制,自動控制Generator函數的流程,接收和交還程序的執行權。回調函數能夠作到這一點,Promise 對象也能夠作到這一點。

co函數庫

若是併發執行異步操做,能夠將異步操做都放入一個數組,跟在yield語句後面。

co(function* () {
  var values = [n1, n2, n3];
  yield values.map(somethingAsync);
});

function* somethingAsync(x) {
  // do something async
  return y
}
相關文章
相關標籤/搜索