MapReduce對大數據進行排序的實踐

從一個小的例子開始: Map和reduce之間的shuffle(洗牌)是將key值相同的放在一塊,sort(排序)是按照key值進行排序.例如like出現了兩次,就會把like放在一起.you也是.然後根據key值進行按照字典的順序進行排序.下面我想將下面的數據按照時間進行排序,並且ID相同的在一塊.具體的數據格式:(數據簡化成如下,其實還包含其他的一些數據) 6395        147384
相關文章
相關標籤/搜索