hadoop 的排序:key排序和分組排序

引入和說明 熟悉mapreduce執行流程的都知道,mapreduce流程中,一共有兩類排序,第一種是對於key的排序,默認是是根據key的遞增排序。第二種是對於reduce的組排序,將兩條記錄的key帶入到 分組函數中,若是返回0,則說明兩個記錄是一組的,因此就把他們的value合到一個迭代器中,也就是reduce函數的第二個參數。java 最下面那個代碼(小標題是整體代碼)包括了 map ,r
相關文章
相關標籤/搜索