7-MapReduce入門

    MapReduce是一種編程模型,用於大規模數據集(大於1TB)的並行運算   通俗的說就是將一個大任務分成多個小任務並行完成,然後合併小任務的結果,得到最終結果。 1)打包注意:  一定要選擇一個MAIN,不然不會運行。   2)             3)輸出目錄是HADOOP自己創建的。如果有這個目錄,一定要刪除。如下: 4)測試命令:   java -jar WordCount.
相關文章
相關標籤/搜索