underscore數組遍歷函數分析(一)

這是underscore源碼剖析系列第三篇文章,主要介紹underscore中each、map、filter、every、reduce等咱們經常使用的一些遍歷數組的方法。css

each

在underscore中咱們最經常使用的就是each和map兩個方法了,這兩個方法通常接收三個參數,分別是數組/對象、函數、上下文。jquery

// iteratee函數有三個參數,分別是item、index、array或者value、key、obj
_.each = _.forEach = function(obj, iteratee, context) {
    // 若是不傳context,那麼each方法裏面的this就會指向window
    iteratee = optimizeCb(iteratee, context);
    var i, length;
    // 若是是類數組,通常來講包括數組、arguments、DOM集合等等
    if (isArrayLike(obj)) {
        for (i = 0, length = obj.length; i < length; i++) {
            iteratee(obj[i], i, obj);
        }
    // 通常是指對象
    } else {
        var keys = _.keys(obj);
        for (i = 0, length = keys.length; i < length; i++) {
            iteratee(obj[keys[i]], keys[i], obj);
        }
    }
    return obj;
};

each函數的源碼很簡單,函數內部會使用isArrayLike方法來判斷當前傳入的第一個參數是類數組或者對象,若是是類數組,直接使用訪問下標的方式來遍歷,並將數組的項和index傳給iteratee函數,若是是對象,則先獲取到對象的keys,再進行遍歷後將對象的value和key傳給iteratee函數ios

不過在這裏,咱們主要分析optimizeCb和isArrayLike兩個函數。git

optimizeCb

// 這個函數主要是給傳進來的func函數綁定context做用域。
    var optimizeCb = function (func, context, argCount) {
        // 若是沒有傳context,那就直接返回func函數
        if (context === void 0) return func;
        // 若是沒有傳入argCount,那就默認是3。這裏是根據第二次傳入的參數個數來給call函數傳入不一樣數量的參數
        switch (argCount == null ? 3 : argCount) {
            case 1: return function (value) {
                return func.call(context, value);
            };
            case 2: return function (value, other) {
                return func.call(context, value, other);
            };
            // 通常是each、map等
            case 3: return function (value, index, collection) {
                return func.call(context, value, index, collection);
            };
            // 通常是reduce等
            case 4: return function (accumulator, value, index, collection) {
                return func.call(context, accumulator, value, index, collection);
            };
        }
        // 若是參數數量大於4
        return function () {
            return func.apply(context, arguments);
        };
    };

其實咱們很容易就看出來optimizeCb函數只是幫func函數綁定context的,若是不存在context,那麼直接返回func,不然則會根據第二次傳給func函數的參數數量來判斷給call函數傳幾個值。
這裏有個重點,爲何要用這麼麻煩的方式,而不直接用apply來將arguments所有傳進去?
緣由是call方法的速度要比apply方法更快,由於apply會對數組參數進行檢驗和拷貝,因此這裏就對經常使用的幾種形式使用了call,其餘狀況下使用了apply,詳情能夠看這裏:call和applygithub

isArrayLike

關於isArrayLike方法,咱們來看underscore的實現。(這個延伸比較多,若是沒興趣,能夠跳過)segmentfault

// 一個高階函數,返回對象上某個具體屬性的值
var property = function (key) {
    return function (obj) {
        return obj == null ? void 0 : obj[key];
    };
};

// 這裏有個ios8上面的bug,會致使相似var pbj = {1: "a", 2: "b", 3: "c"}這種對象的obj.length = 4; jQuery中也有這個bug。
// https://github.com/jashkenas/underscore/issues/2081 
// https://github.com/jquery/jquery/issues/2145
// MAX_SAFE_INTEGER is 9007199254740991 (Math.pow(2, 53) - 1).
// http://ecma-international.org/ecma-262/6.0/#sec-number.max_safe_integer
var MAX_ARRAY_INDEX = Math.pow(2, 53) - 1;

// 聽說用obj["length"]就能夠解決?我沒有ios8的環境,有興趣的能夠試試
var getLength = property('length');

// 判斷是不是類數組,若是有length屬性而且值爲number類型便可視做類數組
var isArrayLike = function (collection) {
    var length = getLength(collection);
    return typeof length == 'number' && length >= 0 && length <= MAX_ARRAY_INDEX;
};

在underscore中,只要帶有length屬性,均可以被認爲是類數組,因此即便是{length: 10}這種狀況也會被歸爲類數組。
我我的感受這樣寫其實太過片面,我仍是更喜歡jQuery裏面isArrayLike方法的實現。數組

function isArrayLike(obj) {
    // Support: real iOS 8.2 only (not reproducible in simulator)
    // `in` check used to prevent JIT error (gh-2145)
    // hasOwn isn't used here due to false negatives
    // regarding Nodelist length in IE
    var length = !!obj && "length" in obj && obj.length,
        type = toType(obj);
    // 排除了obj爲function和全局中有length變量的狀況
    if (isFunction(obj) || isWindow(obj)) {
        return false;
    }
    return type === "array" || length === 0 ||
        typeof length === "number" && length > 0 && (length - 1) in obj;
}

jQuery中使用in來解決ios8下面那個JIT的錯誤,同時還會排除obj是函數和window的狀況,由於若是obj是函數,那麼obj.length則是這個函數參數的個數,而若是obj是window,那麼我在全局中定義一個var length = 10,這個一樣也能獲取到length。app

最後的三個判斷分別是:ide

  1. 若是obj的類型是數組,那麼返回true
  2. 若是obj的length是0,也返回true。即便是{length: 0}這種狀況,由於在調用isArrayLike的each和map等方法中會在for循環裏面判斷length,因此也不會形成影響。
  3. 最後這個(length - 1) in obj我我的理解就是爲了排除{length: 10}這種狀況,由於這個能夠知足length>0和length==="number"的狀況,可是通常狀況下是沒法知足最後(length - 1) in obj的,可是NodeList和arguments這些卻能夠知足這個條件。

map

說完了each,咱們再來講說map,map函數其實和each的實現很相似,不過不同的一個地方在於,map函數的第二個參數不必定是函數,咱們能夠什麼都不傳,甚至還能夠傳個對象。函數

var arr = [{name:'Kevin'}, {name: 'Daisy', age: 18}]
var result1 = _.map(arr); // [{name:'Kevin'}, {name: 'Daisy', age: 18}]
var result2 = _.map(arr, {name: 'Daisy'}) // [false, true]

因此這裏就會對傳入map的第二個參數進行判斷,總體來講map函數的實現比each更加簡潔。

_.map = _.collect = function (obj, iteratee, context) {
        // 由於在map中,第二個參數可能不是函數,因此用cb,這點和each的實現不同。
        iteratee = cb(iteratee, context);
        // 若是不是類數組(是對象),則獲取到keys
        var keys = !isArrayLike(obj) && _.keys(obj),
            length = (keys || obj).length,
            results = Array(length);
        // 這裏根據keys是否存在來判斷傳給iteratee是key仍是index
        for (var index = 0; index < length; index++) {
            var currentKey = keys ? keys[index] : index;
            results[index] = iteratee(obj[currentKey], currentKey, obj);
        }
        return results;
    };

cb

咱們來看看map函數中這個cb函數究竟是什麼來歷?

_.identity = function (value) {
    return value;
};
var cb = function (value, context, argCount) {
    // 若是value不存在
    if (value == null) return _.identity;
    // 若是傳入的是個函數
    if (_.isFunction(value)) return optimizeCb(value, context, argCount);
    // 若是傳入的是個對象
    if (_.isObject(value)) return _.matcher(value);
    return _.property(value);
};

cb函數在underscore中通常是用在遍歷方法中,大多數狀況下value都是一個函數,咱們結合上面map的源碼和例子來看。

  1. 若是value不存在,那就對應上面的_.map(obj)的狀況,map中的iteratee就是_.identity函數,他會將後面接收到的obj[currentKey]直接返回。
  2. 若是value是一個函數,就對應_.map(obj, func)這種狀況,那麼會再調用optimizeCb方法,這裏就和each的實現是同樣的
  3. 若是value是個對象,對應_.map(obj, arrts)的狀況,就會比較obj中的屬性是否在arr裏面,這個時候會調用_.matcher函數
  4. 這種狀況通常是用在_.iteratee函數中,用來訪問對象的某個屬性,具體看這裏:iteratee函數

matcher

那麼咱們再來看matcher函數,matcher函數內部對兩個對象作了淺比較。

_.matcher = _.matches = function (attrs) {
    // 將attrs和{}合併爲一個對象(避免attrs爲undefined)
    attrs = _.extendOwn({}, attrs);
    return function (obj) {
        return _.isMatch(obj, attrs);
    };
};
// isMatch方法會對接收到的attrs對象進行遍歷,同時比較obj中是否有這一項
_.isMatch = function (object, attrs) {
    var keys = _.keys(attrs), length = keys.length;
    // 若是object和attr都是空,那麼返回true,不然object爲空時返回false
    if (object == null) return !length;
    // 這一步沒懂是爲了作什麼?
    var obj = Object(object);
    for (var i = 0; i < length; i++) {
        var key = keys[i];
        if (attrs[key] !== obj[key] || !(key in obj)) return false;
    }
    return true;
};

matcher是個高階方法,他會將兩次接收到的對象傳給isMatch函數來進行判斷。首先是以attrs爲被遍歷的對象,經過對比obj[key]和attrs[key]的值,只要obj中的值和attrs中的不想等,就會返回false。
這裏還會排除一種狀況,若是attrs中對應key的value正好是undefined,並且obj中並無key這個屬性,這樣obj[key]和attrs[key]其實都是undefined,這裏使用!==來比較必然會返回false,實際上二者應該是不想等的。
因此使用in來判斷obj上到底有沒有key這個屬性,若是沒有,也會返回false。若是attrs上面全部屬性在obj中都能找到,而且二者的值正好相等,那麼就會返回true。
這也就是爲何_.map([{name:'Kevin'}, {name: 'Daisy', age: 18}], {name: 'Daisy'}); 會返回 [false, true]。

重寫each

each和map實現原理基本上同樣,不過map更加簡潔,這裏能夠用map的形式重寫一下each

_.each = _.forEach = function (obj, iteratee, context) {
        iteratee = optimizeCb(iteratee, context);
        var keys = !isArrayLike(obj) && _.keys(obj),
            length = (keys || obj).length,
            results = Array(length);
        for (var index = 0; index < length; index++) {
            var currentKey = keys ? keys[index] : index;
            iteratee(obj[currentKey], currentKey, obj);
        }
        return obj;
    };

filter、every、some、reject

這幾種方法的實現和上面的each、map相似,這裏就很少作解釋了,有興趣的能夠本身去看一下。

相關文章
相關標籤/搜索