Hadoop7days-4 MR實現倒排索引

實現倒排索引值得是:將位於不同文件裏面的單詞,統計出其在不同文件中出現的次數,結果應爲 「hello」,"a.txt->3,b.txt->2,c.txt->2" 的形式。要達成這一目標,需要設置多個mapper和reducer類。可以使用倒退的方法,來確定各個mapper和reducer要實現的功能,其步驟如下: mapper 的輸出是 context.write("hell0->a.txt","
相關文章
相關標籤/搜索