MapReduce--1--入門程序WordCount

MapReduce界的helloworld程序就是WordCount程序。所謂WordCount,就是單詞計數,就是用來統計一篇或者一堆文本文件中的各單詞的出現次數。   按照我們普通的編寫代碼的邏輯,單詞計數程序應該是這樣的: 1、逐行讀取文本內容 2、把讀取到的一行文本內容切割爲一個一個的單詞 3、把每個單詞出現一次的信息記錄爲一個key-value,也就是「單詞-1」 4、收集所有相同的單詞
相關文章
相關標籤/搜索