(以爲這部分眼熟的能夠直接跳到下一段了...)javascript
最近開始看 underscore.js 源碼,並將 underscore.js 源碼解讀 放在了個人 2016 計劃中。java
閱讀一些著名框架類庫的源碼,就好像和一個個大師對話,你會學到不少。爲何是 underscore?最主要的緣由是 underscore 簡短精悍(約 1.5k 行),封裝了 100 多個有用的方法,耦合度低,很是適合逐個方法閱讀,適合樓主這樣的 JavaScript 初學者。從中,你不只能夠學到用 void 0 代替 undefined 避免 undefined 被重寫等一些小技巧 ,也能夠學到變量類型判斷、函數節流&函數去抖等經常使用的方法,還能夠學到不少瀏覽器兼容的 hack,更能夠學到做者的總體設計思路以及 API 設計的原理(向後兼容)。git
以後樓主會寫一系列的文章跟你們分享在源碼閱讀中學習到的知識。github
underscore-1.8.3 源碼解讀項目地址 https://github.com/hanzichi/underscore-analysis面試
underscore-1.8.3 源碼全文註釋 https://github.com/hanzichi/underscore-analysis/blob/master/underscore-1.8.3.js/underscore-1.8.3-analysis.js數組
underscore-1.8.3 源碼解讀系列文章 https://github.com/hanzichi/underscore-analysis/issues瀏覽器
歡迎圍觀~ (若是有興趣,歡迎 star & watch~)您的關注是樓主繼續寫做的動力性能優化
今天要聊的,也是我之前筆試時碰到過的一個問題,數組去重,不知道如今的筆試題還考不考這個?框架
數組去重,通常需求是給你一個數組,調用去重方法,返回數值副本,副本中沒有重複元素。通常來講,兩個元素經過 ===
比較返回 true 的視爲相同元素,須要去重,因此,1
和 "1"
是不一樣的元素,1
和 new Number(1)
是不一樣的元素,{}
和 {}
是不一樣的元素(引用不一樣)。(固然若是需求認爲 {}
和 {}
算做相同的元素,那麼解法就不同了)函數
無需思考,咱們能夠獲得 O(n^2) 複雜度的解法。定義一個變量數組 res 保存結果,遍歷須要去重的數組,若是該元素已經存在在 res 中了,則說明是重複的元素,若是沒有,則放入 res 中。
function unique(a) { var res = []; for (var i = 0, len = a.length; i < len; i++) { var item = a[i]; for (var j = 0, jLen = res.length; j < jLen; j++) { if (res[j] === item) break; } if (j === jLen) res.push(item); } return res; } var a = [1, 1, '1', '2', 1]; var ans = unique(a); console.log(ans); // => [1, "1", "2"]
代碼很是簡單,那麼是否能更簡潔些?若是不考慮瀏覽器兼容,咱們能夠用 ES5 提供的 Array.prototype.indexOf 方法來簡化代碼。
function unique(a) { var res = []; for (var i = 0, len = a.length; i < len; i++) { var item = a[i]; (res.indexOf(item) === -1) && res.push(item); } return res; } var a = [1, 1, '1', '2', 1]; var ans = unique(a); console.log(ans); // => [1, "1", "2"]
既然用了 indexOf,那麼不妨再加上 filter。
function unique(a) { var res = a.filter(function(item, index, array) { return array.indexOf(item) === index; }); return res; } var a = [1, 1, '1', '2', 1]; var ans = unique(a); console.log(ans); // => [1, "1", "2"]
法一是將原數組中的元素和結果數組中的元素一一比較,咱們能夠換個思路,將原數組中重複元素的最後一個元素放入結果數組中。
function unique(a) { var res = []; for (var i = 0, len = a.length; i < len; i++) { for (var j = i + 1; j < len; j++) { // 這一步十分巧妙 // 若是發現相同元素 // 則 i 自增進入下一個循環比較 if (a[i] === a[j]) j = ++i; } res.push(a[i]); } return res; } var a = [1, 1, '1', '2', 1]; var ans = unique(a); console.log(ans); // => ["1", "2", 1]
雖然複雜度仍是 O(n^2),可是能夠看到結果不一樣,1 出如今了數組最後面,由於結果數組取的是元素最後一次出現的位置。
若是筆試面試時只答出了上面這樣 O(n^2) 的方案,可能還不能使面試官滿意,下面就來講幾種進階方案。
將數組用 sort 排序後,理論上相同的元素會被放在相鄰的位置,那麼比較先後位置的元素就能夠了。
function unique(a) { return a.concat().sort().filter(function(item, pos, ary) { return !pos || item != ary[pos - 1]; }); } var a = [1, 1, 3, 2, 1, 2, 4]; var ans = unique(a); console.log(ans); // => [1, 2, 3, 4]
可是問題又來了,1
和 "1"
會被排在一塊兒,不一樣的 Object 會被排在一塊兒,由於它們 toString() 的結果相同,因此會出現這樣的錯誤:
var a = [1, 1, 3, 2, 1, 2, 4, '1']; var ans = unique(a); console.log(ans); // => [1, 2, 3, 4]
固然你徹底能夠針對數組中可能出現的不一樣類型,來寫這個比較函數。不過這彷佛有點麻煩。
用 JavaScript 中的 Object 對象來當作哈希表,這也是幾年前筆試時的解法,跟 sort 同樣,能夠去重徹底由 Number 基本類型組成的數組。
function unique(a) { var seen = {}; return a.filter(function(item) { return seen.hasOwnProperty(item) ? false : (seen[item] = true); }); } var a = [1, 1, 3, 2, 1, 2, 4]; var ans = unique(a); console.log(ans); // => [1, 3, 2, 4]
仍是和方法三同樣的問題,由於 Object 的 key 值都是 String 類型,因此對於 1
和 "1"
沒法分別,咱們能夠稍微改進下,將類型也存入 key 中。
function unique(a) { var ret = []; var hash = {}; for (var i = 0, len = a.length; i < len; i++) { var item = a[i]; var key = typeof(item) + item; if (hash[key] !== 1) { ret.push(item); hash[key] = 1; } } return ret; } var a = [1, 1, 3, 2, '4', 1, 2, 4, '1']; var ans = unique(a); console.log(ans); // => [1, 3, 2, "4", 4, "1"]
雖然解決了討厭的 1
和 "1"
的問題,可是還有別的問題!
var a = [{name: "hanzichi"}, {age: 30}, new String(1), new Number(1)]; var ans = unique(a); console.log(ans); // => [Object, String]
可是若是數組元素所有是基礎類型的 Number 值,鍵值對法應該是最高效的!
ES6 部署了 Set 以及 Array.from 方法,太強大了!若是瀏覽器支持,徹底能夠這樣:
function unique(a) { return Array.from(new Set(a)); } var a = [{name: "hanzichi"}, {age: 30}, new String(1), new Number(1)]; var ans = unique(a); console.log(ans); // => [Object, Object, String, Number]
最後來看看 underscore 對此的實現方式,underscore 將此封裝到了 _.unique 方法中,調用方式爲 _.unique(array, [isSorted], [iteratee])。其中第一個參數是必須的,是須要去重的數組,第二個參數可選,若是數組有序,則能夠傳入布爾值 true,第三個參數可選,若是須要對數組迭代的結果去重,則能夠傳入一個迭代函數。而數組元素去重是基於 ===
運算符的。
其實很簡單,underscore 中的實現方式和上面的方法一類似。
咱們來看它的核心代碼:
for (var i = 0, length = getLength(array); i < length; i++) { var value = array[i], // 若是指定了迭代函數 // 則對數組每個元素進行迭代 computed = iteratee ? iteratee(value, i, array) : value; // 若是是有序數組,則當前元素只需跟上一個元素對比便可 // 用 seen 變量保存上一個元素 if (isSorted) { // 若是 i === 0,則直接 push // 不然比較當前元素是否和前一個元素相等 if (!i || seen !== computed) result.push(value); // seen 保存當前元素,供下一次對比 seen = computed; } else if (iteratee) { // 若是 seen[] 中沒有 computed 這個元素值 if (!_.contains(seen, computed)) { seen.push(computed); result.push(value); } } else if (!_.contains(result, value)) { // 若是不用通過迭代函數計算,也就不用 seen[] 變量了 result.push(value); } }
外面的循環遍歷數組元素,對於每一個元素,若是數組有序,則和前一個元素比較,若是相同,則已經出現過,不加入到結果數組中,不然則加入。而若是有迭代函數,則計算傳入迭代函數後的值,對值去重,調用 _.contains 方法,而該方法的核心就是調用 _.indexOf 方法,和咱們上面說的方法一殊途同歸。
關於 _.unique 方法的詳細代碼,能夠參考 https://github.com/hanzichi/underscore-analysis/blob/master/underscore-1.8.3.js/src/underscore-1.8.3.js#L519-L547