大數據求索(3):實戰MapReduce

MapReduce 概述 主要用於離線、海量數據運算 WordCount編寫 下面這張經典圖很好地說明了如何編寫一個WordCount,也清楚說明了MapReduce的流程 對於輸入的一個文本(可以存放在HDFS上,可以非常非常大),先對文件進行拆分,假設這裏一行一份,對於每一行,按空格進行切分,然後給每個單詞賦初值爲1,這裏同一個map裏有相同的單詞,也是不會覆蓋的,會保留兩個(word, 1)
相關文章
相關標籤/搜索