Hadoop——day2

MapReduce 核心思想 分治 先分再合 map負責分,即將複雜任務拆分爲可並行計算且幾乎沒有依賴關係的小任務 reduce負責合,即對map階段的結果進行彙總 模擬MapReduce計算 需求:統計文件中每個單詞出現的總次數 不採用mr的傳統處理方式 1.建立java項目,引入hdfs的jar包,通過fs.copyToLocalFile() 2.讀取文件,切割單詞,統計次數 採用MapRed
相關文章
相關標籤/搜索