大數據Map Reduce 和 MPP數據庫 的區別

下面在這篇文章裏對MR的解釋很好, 從原理的角度出發, map reduce其實就是二分查找的一個逆過程, 不過因爲計算節點有限, 所以map和reduce前都預先有一個分區的步驟. 二分查找要求數據是排序好的, 所以Map Reduce之間會有一個shuffle的過程對Map的結果排序. Reduce的輸入是排好序的. http://www.javashuo.com/article/p-bbrv
相關文章
相關標籤/搜索