Hadoop_20_MapReduce程序的運行模式

1.MapReduce程序的運行模式linux

1. Windows中運行MapReduce程序windows

1)mapreduce程序是被提交給LocalJobRunner在本地以單進程的形式運行併發

2)而處理的數據及輸出結果能夠在本地文件系統,也能夠在hdfs上eclipse

3)設置MapReduce程序的conf配置參數(不配默認)ide

4)本地模式很是便於進行業務邏輯的debug,只要在eclipse中打斷點便可oop

5)在windows下運行本地模式來測試程序邏輯,須要在windows中配置環境變量:測試

HADOOP_HOME% = d:/hadoop-2.6.1  %PATH% = %HADOOP_HOME%\bin(記得重啓)spa

而且要將d:/hadoop-2.6.4lib和bin目錄替換成windows平臺編譯的版本debug

運行程序:orm

 

2. 集羣運行MapReduce程序

1)將mr程序提交給yarn集羣resourcemanager,分發到不少的節點上併發執行

2)處理的數據和輸出結果應該位於hdfs文件系統

3)提交集羣的實現步驟:

A、將程序打成JAR包,而後在集羣的任意一個節點上用hadoop命令啓動

 hadoop jar workcount.jar ..WordcountDriver /wc/input1 /wc/output

B、直接在linux的eclipse中運行main方法

(項目中要帶參數:mapreduce.framework.name=yarn以及yarn的兩個基本配置)

C、若是在windows的eclipse中提交MR集羣運行,則要修改YarnRunner類

相關文章
相關標籤/搜索