Hadoop Mapreduce分區、分組、鏈接以及輔助排序(也叫二次排序)過程詳解

一、MapReduce中數據流動    (1)最簡單的過程:  map - reduce    (2)定製了partitioner以將map的結果送往指定reducer的過程: map - partition - reduce    (3)增長了在本地先進性一次reduce(優化)過程: map - combin(本地reduce) - partition -reduce 二、Mapreduce中
相關文章
相關標籤/搜索