MapReduce實戰:郵箱統計及多輸出格式實現

  緊接着上一篇博文我們學習了MapReduce得到輸出格式之後,在這篇博文裏,我們將通過一個實戰小項目來熟悉一下MultipleOutputs(多輸出)格式的用法。 項目需求:   假如這裏有一份郵箱數據文件,我們期望統計郵箱出現次數並按照郵箱的類別,將這些郵箱分別輸出到不同文件路徑下(MultipleOutputs)。數據集示例如下所示。   [email protected]com   [e
相關文章
相關標籤/搜索