MapReduce中的map,shuffle、partition和combiner,reduce的含義及作用

Hadoop的計算框架主要是兩個過程分別是map和reduce,但是還有好幾個過程跟性能調優有關。如:shuffle、partition和combiner。 shuffle:數據從map端傳輸到reduce端的過程。據說是可以期待奇蹟發生的環節。 計算框架總體的過程如下: map階段:從磁盤讀入數據 --> map函數 --> combine結果(非必需的過程)--> 結果寫回磁盤。 map階段中
相關文章
相關標籤/搜索