MapReduce --全排序

MapReduce全排序的方法1:   每個map任務對自己的輸入數據進行排序,但是無法做到全局排序,需要將數據傳遞到reduce,然後通過reduce進行一次總的排序,但是這樣做的要求是隻能有一個reduce任務來完成。   並行程度不高,無法發揮分佈式計算的特點。   MapReduce全排序的方法2:   針對方法1的問題,現在介紹方法2來進行改進;   使用多個partition對map的
相關文章
相關標籤/搜索