一個單詞統計的實例,怎樣通過MapReduce完成排序?

假設有一批海量的數據,每個數據都是由26個字母組成的字符串,原始的數據集合是完全無序的,怎樣通過MapReduce完成排序工作,使其有序(字典序)呢? 對原始的數據進行分割(Split),得到N個不同的數據分塊: 實例分析:WordCount 這個類實現Mapper接口中的map 方法,輸入參數中的value 是文本文件中的一行,利用StringTokenizer將這個字符串拆成單詞,然後將輸出結
相關文章
相關標籤/搜索