理解MapReduce計算構架

用Python編寫WordCount程序任務app

程序函數

WordCountoop

輸入測試

一個包含大量單詞的文本文件3d

輸出blog

文件中每一個單詞及其出現次數(頻數),並按照單詞字母順序排序,每一個單詞和其頻數佔一行,單詞和頻數之間有間隔排序

一、編寫map函數,reduce函數table

      (1)首先建立一個文件夾class

    mkdir wc權限

       (2)編寫兩個mapper函數

    

 

二、將其權限做出相應修改

  

三、本機上測試運行代碼

  

四、放到HDFS上運行,下載並上傳文件到hdfs上

  

五、用Hadoop Streaming命令提交任務




相關文章
相關標籤/搜索