理解MapReduce計算構架

 

  1. 用Python編寫WordCount程序任務

程序函數

WordCountoop

輸入測試

一個包含大量單詞的文本文件3d

輸出blog

文件中每一個單詞及其出現次數(頻數),並按照單詞字母順序排序,每一個單詞和其頻數佔一行,單詞和頻數之間有間隔排序

1.編寫map函數,reduce函數class

  編寫函數權限

 

2.將其權限做出相應修改map

 

3.本機上測試運行代碼下載

4.放到HDFS上運行

 

5.下載並上傳文件到hdfs上

 

6.用Hadoop Streaming命令提交任務

相關文章
相關標籤/搜索