mapreduce二次排序案例

爲什麼需要二次排序? 在MapReduce操作時,我們知道傳遞的<key,value>會按照key的大小進行排序,最後輸出的結果是按照key排過序的。有的時候我們在key排序的基礎上,對value也進行排序。這種需求就是二次排序: 解決思路: 我們可以把key和value聯合起來作爲新的key,記作newkey。這時,newkey含有兩個字段,假設分別是k,v。這裏的k和v是原來的key和valu
相關文章
相關標籤/搜索