原文地址:itweknow.cn/detail?id=6… ,歡迎你們訪問。node
前面咱們介紹了在Ubuntu上安裝Hadoop單機版。可是咱們知道,Hadoop在實際工做中都是以集羣的形式存在的,畢竟須要處理大量的數據,單機的處理速度顯然不能知足。因此這篇文章咱們就來介紹一下如何在Ubuntu上搭建Hadoop 集羣。瀏覽器
- 三臺在同一局域網內的Linux機器或者虛擬機。
- 配置好Host文件,讓三臺機器能夠經過主機名進行訪問。
- 三臺機器上都安裝了JDK。
- 在其中一臺上安裝好Hadoop,安裝方法能夠參考前面的文章。
你可能很奇怪我要搭建的是Hadoop集羣,爲啥須要配置SSH免密登陸呢。有兩點緣由:bash
core-site.xml
,只須要修改fs.defaultFS
配置項便可,hadoop.tmp.dir
不須要修改。<property>
<name>fs.defaultFS</name>
<!-- 修改成namenode的地址,改爲主機名 -->
<value>hdfs://test:9000</value>
</property>
複製代碼
<!-- 指定HDFS副本的數量 -->
<property>
<name>dfs.replication</name>
<value>2</value>
</property>
複製代碼
其實在咱們搭建好一臺機器的Hadoop環境後只須要下面幾步就能夠完成集羣環境的搭建了:app
前面兩步我寫好了腳本,直接執行一下就能夠了。第3步中說的slave文件在hadoop的安裝目錄下的etc/hadoop/slave,我這裏用的test01和test02兩臺機器作datanode。oop
test01
test02
複製代碼
腳本地址 附上腳本使用說明ui
- 須要保證腳本文件夾中的兩個腳本文件在同一目錄下。
- 若是Hadoop的安裝目錄不爲/root/apps/hadoop/hadoop-2.8.5,則須要修改腳本中hadoop的安裝位置(兩個腳本中都須要修改)。
- 修改腳本中機器名稱,SERVERS變量。
在namenode機器上執行下面的命令spa
start-all.sh
複製代碼
在瀏覽器中訪問`http://{機器IP}:50070,查看到以下結果即表明成功。 code