Hadoop7days-4 combiner

每一個map可能會產生大量的輸出,combiner的作用就是在map端對輸出先做一次合併,以減少傳輸到reducer的數據量。 combiner最基本是實現本地key的歸併,combiner具有類似本地的reduce功能。 注意:Combiner的輸出是Reducer的輸入,如果Combiner是可插拔的,添加Combiner絕不能改變最終的計算結果。所以Combiner只應該用於那種Reduce
相關文章
相關標籤/搜索