hadoop-之二次排序&分組&分區

需求背景 MapReduce框架對處理結果的輸出會根據key值進行默認的排序,這個默認排序能夠知足一部分需求,可是也是十分有限的。在咱們實際的需求當中,每每有要對reduce輸出結果進行二次排序的需求。對於二次排序的實現,本文將經過兩個個實際的MapReduce二次排序例子,講述二次排序的實現和其MapReduce的整個處理流程,而且經過結果和map、reduce端的日誌來驗證所描述的處理流程的正
相關文章
相關標籤/搜索