MR自定義二次排序

在一個數據文件中,首先按照key排序。 在key相同的情況下,按照value大小排序的情況稱爲二次排序。 自定義key :NewKey實現比較規則 自定義GroupingComparator方法 在map階段,使用job.setInputFormatClass定義的InputFormat將輸入的數據集分割成小數據塊splites,同時InputFormat提供一個RecordReder的實現。比如
相關文章
相關標籤/搜索