Mac-搭建Hadoop集羣

You have to work very hard to believe that you are really powerless.java

 

Mac-搭建Hadoop集羣node

我用到了:VMware Fusion、CentOS七、FileZilla、jdk-8u181-linux-x64.tar.gz和hadoop-2.7.6.tar.gzmysql

一、集羣部署規劃linux

NameNode單點部署:web

節點名稱 NN1 NN2 DN RM NM 規劃IP other
tjt01 NameNode   DataNode   NodeManager 172.16.114.130 hive/hdfs
tjt02   SecondaryNameNode DataNode ResourceManager NodeManager 172.16.114.131 hbase/kms
tjt03     DataNode   NodeManager 172.16.114.132 mysql/spark

 

二、三臺客戶機相關準備sql

2.一、安裝VMware虛擬機瀏覽器

在虛擬機中安裝CentOS鏡像,由初始安裝的CentOS7版本的鏡像,完整克隆出另外兩臺虛擬機bash

2.二、修改主機名服務器

[root@tjt01 tjt]# vi /etc/hostname

分別修改三臺虛擬機主機名:tjt0一、tjt0二、tjt03less

2.三、修改host文件

配置主機host:

[root@tjt01 tjt]# vi /etc/hosts

 

將配置發送到其餘的主機,同時在其餘主機上配置:

scp -r /etc/hosts root@tjt02:/etc/
scp -r /etc/hosts root@tjt03:/etc/

測試host文件修改結果:

ping tjt01 ping tjt02 ping tjt03

2.四、設置SSH免密登陸

每兩臺主機之間設置免密碼,本身的主機與本身的主機之間也要求設置免密碼;

輸入:ssh-keygen -t rsa

而後按下四次回車,以後在把密匙發到其餘主機上,輸入:ssh-copy-id tjt01 並按提示輸入密碼,而後是ssh-copy-id 02和ssh-copy-id 03一樣的操做;

以後,在另外兩臺虛擬機上也執行相同的步驟:

ssh-keygen -t rsa ssh-copy-id tjt01 ssh-copy-id tjt02 ssh-copy-id tjt03
測試SSH免密登陸:
ssh tjt0一、ssh tjt0二、ssh tjt03
2.五、安裝配置JDK
虛擬機默認安裝了一個openjdk,卸載掉:
rpm -qa | grep jdk
能夠查看已經安裝了的openjdk
yum remove *openjdk*
幹掉openjdk
yum remove copy-jdk-configs-3.3-10.el7_5.noarch
幹掉jdk-configs

將JDK安裝包上傳到/opt下,能夠經過XShell的rz上傳,也能夠用FileZilla:

到/opt 目錄下解壓:tar xzvf jdk-8u181-linux-x64.tar.gz

設置JAVA_HOME:

輸入:vi /etc/profile,在profile文件中的編輯模式下加上下方export配置:

export JAVA_HOME=/opt/jdk1.8.0_181 export PATH=$PATH:$JAVA_HOME/bin:$JAVA_HOME/sbin
修改好以後使文件生效:source /etc/profile

複製JDK到另外兩個節點:

在這以前要先把另外兩臺虛擬機上的openjdk也幹掉:

yum remove *openjdk*
yum remove copy-jdk-configs-3.3-10.el7_5.noarch

而後複製jdk到另外兩個虛擬機上:

scp -r /opt/jdk1.8.0_181 root@tjt02:/opt/
scp -r /opt/jdk1.8.0_181 root@tjt03:/opt/

向其餘節點複製profile文件:

scp /etc/profile root@tjt02:/etc/
scp /etc/profile root@tjt03:/etc/

而後每一個節點分別執行 source /etc/profile ,使profile生效下,並經過java-version簡單測試下,jdk複製是否成功:

tjt02:

tjt03:

三、安裝Hadoop

3.一、上傳並解壓Hadoop

解壓:tar zxvf hadoop-2.7.6.tar.gz

3.二、搭建Hadoop集羣

配置文件在hadoop2.7.6/etc/hadoop/下,修改設置hadoop2.7.6目錄下的可執行權限

3.2.一、修改 core-site.xml

[root@tjt01 hadoop]# vi core-site.xml

而後在core-site.xml文件中編輯以下:

<!-- 指定HDFS中NameNode的地址 --> 
     <property>
     <name>fs.defaultFS</name>
         <value>hdfs://tjt01:9000</value>
     </property>
<!-- 指定hadoop運行時產生文件的存儲目錄 --> <property> 
     <name>hadoop.tmp.dir</name>
     <value>/opt/hadoop-2.7.6/data/full/tmp</value>
     </property>

3.2.二、修改hadoop-env.sh

[root@tjt01 hadoop]# vi hadoop-env.sh 

修改JAVA_HOME:

3.2.3 修改hdfs-site.xml

[root@tjt01 hadoop]# vi hdfs-site.xml 

修改 hdfs-site.xml 的配置以下:

<configuration>

<!-- 設置dfs副本數,不設置默認是3個 --> 
    <property>
        <name>dfs.replication</name>
        <value>2</value>
</property>

<!-- 設置secondname的端口 --> 
<property> 
  <name>dfs.namenode.secondary.http-address</name>
        <value>tjt02:50090</value>
    </property>
</configuration>

3.2.4 修改 slaves

[root@tjt01 hadoop]# vi slaves

增長slaves 配置以下:

tjt01
tjt02
tjt03

3.2.5 修改mapred-env.sh

[root@tjt01 hadoop]# vi mapred-env.sh 

修改其JAVA_HOME以下:

export JAVA_HOME=/opt/jdk1.8.0_181

3.2.6 修改mapred-site.xml

[root@tjt01 hadoop]# mv mapred-site.xml.template mapred-site.xml [root@tjt01 hadoop]# vi mapred-site.xml 

修改其configuration以下:

<configuration>
<!-- 指定mr運行在yarn上 -->
    <property>
     <name>mapreduce.framework.name</name>
     <value>yarn</value>
    </property>
</configuration>

3.2.7 修改yarn-env.sh

[root@tjt01 hadoop]# vi yarn-env.sh 

修改其JAVA_HOME以下:

export JAVA_HOME=/opt/jdk1.8.0_181

3.2.8 修改yarn-site.xml

[root@tjt01 hadoop]# vi yarn-site.xml

修改配置以下:

<configuration>
<!-- reducer獲取數據的方式 --> 
<property> 
 <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
     </property>
<!-- 指定YARN的ResourceManager的地址 --> 
<property> <name>yarn.resourcemanager.hostname</name> <value>tjt02</value> </property> <property> <name>yarn.nodemanager.vmem-check-enabled</name> <value>false</value> <description>Whether virtual memory limits will be enforced for containers</description> </property> <property> <name>yarn.nodemanager.vmem-pmem-ratio</name> <value>4</value> <description>Ratio between virtual memory to physical memory when setting memory limits for containers</description> </property> </configuration>

3.3 分發hadoop到各個節點

[root@tjt01 hadoop]# scp -r /opt/hadoop-2.7.6/ root@tjt02:/opt
[root@tjt01 hadoop]# scp -r /opt/hadoop-2.7.6/ root@tjt03:/opt

3.4 配置環境變量

[root@tjt01 hadoop]# vi /etc/profile

修改配置以下:

export HADOOP_HOME=/opt/hadoop-2.7.6 export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

source /etc/profile 使profile文件生效;

[root@tjt01 hadoop]# source /etc/profile

3.5 分發profile到各個節點

[root@tjt01 hadoop]# scp /etc/profile root@tjt02:/etc/
[root@tjt01 hadoop]# scp /etc/profile root@tjt03:/etc/

到各自的服務節點上是profile 生效:

[root@tjt02 ~]# source /etc/profile
[root@tjt03 ~]# source /etc/profile

4 啓動驗證集羣

4.1 啓動集羣

4.1.1 若是集羣是第一次啓動,須要格式化namenode
[root@tjt01 hadoop]# hdfs namenode -format

當看到19/05/03 03:45:47 INFO common.Storage: Storage directory /opt/hadoop-2.7.6/data/full/tmp/dfs/name has been successfully formatted. 就格式化OK了;

到此爲止,上面存在有一個錯誤,不能在hdfs-site.xml文件中這麼寫註釋【#tjt】:
4.1.2 啓動Hdfs
[root@tjt01 hadoop-2.7.6]# start-dfs.sh

4.1.3 啓動Yarn

 若是Namenode和ResourceManager不是同一臺虛擬機的話,不能在NameNode上啓動yarn,應該在ResourceManager所在的機器上啓動yarn;個人yarn配置在tjt02服務器上,一次須要到tjt02機器上啓動yarn

[root@tjt02 hadoop]# start-yarn.sh

4.1.4 jps查看進程
[root@tjt01 hadoop]# jps

[root@tjt02 hadoop]# jps

[root@tjt03 hadoop]# jps

4.1.5 web頁面訪問

 在虛擬機tjt01上訪問:http://172.16.114.130:50070

Datanode:

須要先在tjt3這臺機器上關閉防火牆後,才能夠在非linux服務器中的瀏覽器訪問:

 //臨時關閉
systemctl stop firewalld
//禁止開機啓動
systemctl disable firewalld

本機訪問:http://172.16.114.130:50070/

 

在虛擬機tjt02上訪問:http://172.16.114.131:8088/cluster

 4.二、Hadoop中止啓動方式

1)各個服務組件逐一啓動

分別啓動hdfs 組件:

hadoop-deamon.sh start | stop namenode | datnode | secondarynamenode

啓動yarn:

yarn-deamon.sh start | stop resourcemanager | nodemanager

2) 各個模塊分開啓動(經常使用)

start | stop-dfs.sh start | stop-yarn.sh

3) 所有啓動

start | stop-all.sh

其餘

一、關閉防火牆

 //臨時關閉
systemctl stop firewalld //禁止開機啓動
systemctl disable firewalld

二、建立用戶,設置文件權限

建立用戶,修改密碼:

[root@tjt01 ~]# useradd tjt [root@tjt01 ~]# passwd tjt

設置tjt用戶具備root權限 修改 /etc/sudoers 文件,找到下面一行,在root下面添加一行,以下所示:

 

修改完畢,如今能夠用tjt賬號登陸,而後用命令 su - ,便可得到root權限進行操做。

 

其實,當Web頁面訪問:http://172.16.114.130:50070,能夠看到hadoop頁面時Hadoop集羣就成功構建好了。
相關文章
相關標籤/搜索