2、Ubuntu14.04下安裝Hadoop2.4.0 （僞分佈模式）

時間 2019-11-19

標籤 ubuntu14.04 ubuntu 安裝 hadoop2.4.0 hadoop 分佈模式欄目 Ubuntu 简体版

原文原文鏈接

在Ubuntu14.04下安裝Hadoop2.4.0 （單機模式）基礎上配置

1、配置core-site.xml

/usr/local/hadoop/etc/hadoop/core-site.xml 包含了hadoop啓動時的配置信息。html

編輯器中打開此文件node

sudo gedit /usr/local/hadoop/etc/hadoop/core-site.xmlapache

在該文件的<configuration></configuration>之間增長以下內容：瀏覽器

<property>框架

<name>fs.default.name</name>編輯器

<value>hdfs://localhost:9000</value>oop

</property>spa

保存、關閉編輯窗口。3d

最終修改後的文件內容以下：orm

2、配置yarn-site.xml

/usr/local/hadoop/etc/hadoop/yarn-site.xml包含了MapReduce啓動時的配置信息。

編輯器中打開此文件

sudo gedit yarn-site.xml

在該文件的<configuration></configuration>之間增長以下內容：

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>

<value>org.apache.hadoop.mapred.ShuffleHandler</value>

</property>

保存、關閉編輯窗口

最終修改後的文件內容以下

3、建立和配置mapred-site.xml

默認狀況下，/usr/local/hadoop/etc/hadoop/文件夾下有mapred.xml.template文件，咱們要複製該文件，並命名爲mapred.xml，該文件用於指定MapReduce使用的框架。

複製並重命名

cp mapred-site.xml.template mapred-site.xml

編輯器打開此新建文件

sudo gedit mapred-site.xml

在該文件的<configuration></configuration>之間增長以下內容：

<name>mapreduce.framework.name</name>

</property>

保存、關閉編輯窗口

最終修改後的文件內容以下

4、配置hdfs-site.xml

/usr/local/hadoop/etc/hadoop/hdfs-site.xml用來配置集羣中每臺主機均可用，指定主機上做爲namenode和datanode的目錄。

建立文件夾，以下圖所示

你也能夠在別的路徑下建立上圖的文件夾，名稱也能夠與上圖不一樣，可是須要和hdfs-site.xml中的配置一致。

編輯器打開hdfs-site.xml

在該文件的<configuration></configuration>之間增長以下內容：

<name>dfs.replication</name>

</property>

<name>dfs.namenode.name.dir</name>

<value>file:/usr/local/hadoop/hdfs/name</value>

</property>

<name>dfs.datanode.data.dir</name>

<value>file:/usr/local/hadoop/hdfs/data</value>

</property>

保存、關閉編輯窗口

最終修改後的文件內容以下：

5、格式化hdfs

hdfs namenode -format

只須要執行一次便可，若是在hadoop已經使用後再次執行，會清除掉hdfs上的全部數據。

6、啓動Hadoop

通過上文所描述配置和操做後，下面就能夠啓動這個單節點的集羣

執行啓動命令：

sbin/start-dfs.sh

執行該命令時，若是有yes /no提示，輸入yes，回車便可。

接下來，執行：

sbin/start-yarn.sh

執行完這兩個命令後，Hadoop會啓動並運行

執行 jps命令，會看到Hadoop相關的進程，以下圖：

瀏覽器打開 http://localhost:50070/，會看到hdfs管理頁面

瀏覽器打開http://localhost:8088，會看到hadoop進程管理頁面

7、WordCount驗證

dfs上建立input目錄

bin/hadoop fs -mkdir -p input

把hadoop目錄下的README.txt拷貝到dfs新建的input裏

hadoop fs -copyFromLocal README.txt input

運行WordCount

hadoop jar share/hadoop/mapreduce/sources/hadoop-mapreduce-examples-2.4.0-sources.jar org.apache.hadoop.examples.WordCount input output

能夠看到執行過程

運行完畢後，查看單詞統計結果

hadoop fs -cat output/*

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。