Ubuntu上安裝Hadoop集羣

時間 2019-12-13

原文原文鏈接

原文地址：itweknow.cn/detail?id=6… ，歡迎你們訪問。node

前面咱們介紹了在Ubuntu上安裝Hadoop單機版。可是咱們知道，Hadoop在實際工做中都是以集羣的形式存在的，畢竟須要處理大量的數據，單機的處理速度顯然不能知足。因此這篇文章咱們就來介紹一下如何在Ubuntu上搭建Hadoop 集羣。瀏覽器

三臺在同一局域網內的Linux機器或者虛擬機。

配置好Host文件，讓三臺機器能夠經過主機名進行訪問。

三臺機器上都安裝了JDK。

在其中一臺上安裝好Hadoop，安裝方法能夠參考前面的文章。

你可能很奇怪我要搭建的是Hadoop集羣，爲啥須要配置SSH免密登陸呢。有兩點緣由：bash

在啓動集羣上全部的節點的時候無需重複輸入密碼。
咱們在搭建集羣的時候須要將Hadoop的文件夾複製到其餘機器上，若是是一兩臺的話copy起來很快，可是若是是幾百臺呢，因此這個時候若是機器之間能夠免密登陸的話咱們能夠很方便的使用腳本完成整個工做。具體的配置方式能夠看下我以前的文章，SSH免密登陸（內含批量配置腳本）

<property>
    <name>fs.defaultFS</name>
    <!-- 修改成namenode的地址，改爲主機名 -->
    <value>hdfs://test:9000</value>
</property>
複製代碼

<!-- 指定HDFS副本的數量 -->
<property>
    <name>dfs.replication</name>
    <value>2</value>
</property>

複製代碼

其實在咱們搭建好一臺機器的Hadoop環境後只須要下面幾步就能夠完成集羣環境的搭建了：app

前面兩步我寫好了腳本，直接執行一下就能夠了。第3步中說的slave文件在hadoop的安裝目錄下的etc/hadoop/slave，我這裏用的test01和test02兩臺機器作datanode。oop

test01
test02
複製代碼

腳本地址附上腳本使用說明ui

須要保證腳本文件夾中的兩個腳本文件在同一目錄下。

若是Hadoop的安裝目錄不爲/root/apps/hadoop/hadoop-2.8.5，則須要修改腳本中hadoop的安裝位置（兩個腳本中都須要修改）。

修改腳本中機器名稱，SERVERS變量。

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。