Hadoop_20_MapReduce程序的運行模式

時間 2019-11-10

標籤 hadoop mapreduce 程序運行模式欄目 Hadoop 简体版

原文原文鏈接

1.MapReduce程序的運行模式linux

1. Windows中運行MapReduce程序windows

（1）mapreduce程序是被提交給LocalJobRunner在本地以單進程的形式運行併發

（2）而處理的數據及輸出結果能夠在本地文件系統，也能夠在hdfs上eclipse

（3）設置MapReduce程序的conf配置參數(不配默認)：ide

（4）本地模式很是便於進行業務邏輯的debug，只要在eclipse中打斷點便可oop

（5）在windows下運行本地模式來測試程序邏輯，須要在windows中配置環境變量：測試

％HADOOP_HOME％ = d:/hadoop-2.6.1 %PATH% = ％HADOOP_HOME％\bin(記得重啓)spa

而且要將d:/hadoop-2.6.4的lib和bin目錄替換成windows平臺編譯的版本debug

運行程序：orm

2. 集羣運行MapReduce程序

（1）將mr程序提交給yarn集羣resourcemanager，分發到不少的節點上併發執行

（2）處理的數據和輸出結果應該位於hdfs文件系統

（3）提交集羣的實現步驟：

A、將程序打成JAR包，而後在集羣的任意一個節點上用hadoop命令啓動：

　hadoop jar workcount.jar ..WordcountDriver /wc/input1 /wc/output

B、直接在linux的eclipse中運行main方法

（項目中要帶參數：mapreduce.framework.name=yarn以及yarn的兩個基本配置）

C、若是在windows的eclipse中提交MR到集羣運行，則要修改YarnRunner類

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。