hadoop-之二次排序&分組&分區

時間 2019-12-09

原文原文鏈接

需求背景 MapReduce框架對處理結果的輸出會根據key值進行默認的排序，這個默認排序能夠知足一部分需求，可是也是十分有限的。在咱們實際的需求當中，每每有要對reduce輸出結果進行二次排序的需求。對於二次排序的實現，本文將經過兩個個實際的MapReduce二次排序例子，講述二次排序的實現和其MapReduce的整個處理流程，而且經過結果和map、reduce端的日誌來驗證所描述的處理流程的正

>>阅读原文<<