Hadoop-HA集羣搭建-rehl7.4

時間 2019-11-19

標籤 hadoop 集羣搭建 rehl7.4 rehl 欄目 Hadoop 简体版

原文原文鏈接

Hadoop-HA集羣搭建-rehl7.4

hadoop

無說明須要登陸其它機器操做，都是在集羣的HD-2-101上執行的命令。
全部安裝包地址：百度網盤，提取碼：24oyphp

1. 基礎環境配置

1.1 克隆虛擬機

虛擬的安裝與靜態IP等配置見：Linux傳送門彙總html

鼠標點擊虛擬機，右鍵管理 -> 克隆

點擊克隆

點擊下一步，克隆自當前狀態或快照 -> 選擇完整克隆。
修改虛擬機名稱，選擇存儲位置，點擊完成。等待克隆完成。

虛擬機存儲選擇

依照上面方法克隆所需臺虛擬機。

1.2 修改靜態IP

點擊開啓全部虛擬機。
vmware進入虛擬機打開 /etc/sysconfig/network-scripts/ifcfg-ens33 修改靜態IP字段 IPADDR。
重啓網絡服務：systemctl restart network.service

注：這裏配置三臺機器(192.168.2.101;192.168.2.102;192.168.2.103)java

1.3 本機依賴安裝

# 先安裝本機的依賴，其它沒有的依賴後續再安裝，目前我電腦如今須要的就這幾個o_0
yum install tcl-devel.x86_64 rsync.x86_64 ntp.x86_64 -y

1.4 配置羣改

shell腳本內容：node

配置當前機器到其他機器的信任
shell腳本修改主機名映射
shell分發hosts主機列表映射文件
關閉防火牆
關閉SELinux
後續再添加其餘功能 …

執行步驟：linux

上傳autoconfig.tar.gz到101機器home目錄下解壓，tar -zxvf autoconfig.tar.gz -C /home
修改腳本host.list文件 /home/autoconfig/etc/host.list

host.list

修改腳本自帶hosts文件 /home/autoconfig/file/hosts，會分發到全部機器覆蓋/etc/hosts，注意與host.list主機名映射不要出錯。

hosts

4.切換到/home/autoconfig/bin目錄執行：sh autoconfig.sh all
5.分發到全部機器執行。git

cd /home/autoconfig/bin;
sh xsync "/home/autoconfig" "/home";
sh doCommand other "cd /home/autoconfig/bin/; sh autoconfig.sh trust";

重啓全部機器

sh doCommand other "init 0";
init 0;

1.5 安裝依賴

cd /home/autoconfig/bin;
sh doCommand all "yum install tcl-devel.x86_64 rsync.x86_64 ntp.x86_64 -y"

1.6 安裝jdk

首先要檢查全部機器是否安裝java，並卸載github

檢查：sh doCommand all "rpm -qa | grep java";
卸載用:rpm -e --nodeps 要卸載的軟件包shell

sh doCommand all "mkdir -p /opt/cluster";

jdk上傳到101機器/opt/cluster下
解壓並分發到其他機器。

tar -zxvf /opt/cluster/jdk-8u144-linux-x64.tar.gz;
sh xsync "/opt/cluster/jdk1.8.0_144" "/opt/cluster";

建立鏈接

# java版本是jdk1.8.0_144
sh doCommand all "ln -s /opt/cluster/jdk1.8.0_144 /opt/cluster/java";

添加到環境變量，全部機器/etc/profile追加如下內容

#JAVA_HOME
export JAVA_HOME=/opt/cluster/java
export PATH=$PATH:$JAVA_HOME/bin

1.7 時間同步

注：這裏選擇HD-2-101爲ntpd對時服務器apache

修改/etc/ntp.conf文件

restrict 192.168.2.0 mask 255.255.255.0 nomodify notrap restrict 127.0.0.1
# 註釋掉如下，內網中不能使用外網的
#server 0.centos.pool.ntp.org iburst
#server 1.centos.pool.ntp.org iburst
#server 2.centos.pool.ntp.org iburst
#server 3.centos.pool.ntp.org iburst
# 修改當該節點丟失網絡鏈接，依然能夠採用本地時間做爲時間服務器爲集羣中的其餘節點提供時間同步
server 127.127.1.0
fudge 127.127.1.0 stratum 5

修改/etc/sysconfig/ntpd文件

# 增長內容以下（讓硬件時間與系統時間一塊兒同步）
SYNC_HWCLOCK="yes"

增長定時任務，增長/etc/cron.d/ntp_crond文件，內容以下

*/10 * * * * root /usr/sbin/ntpdate HD-2-101

分發文件定時文件

sh xsync "/etc/cron.d/ntp_crond" "/etc/cron.d";

重啓crond服務

# 重啓
sh doCommand all "systemctl restart crond.service"

檢查對時服務器機器上狀態，對時啓動大約須要5分鐘。

# reach是已經向上層NTP服務器要求更新的次數，是一個八進制，每次改變是poll對應的秒數，等reach大於等於17其它服務器就可對本服務器對時了。
watch ntpq -p

ntpd狀態

手動第一次對時

# 保證其餘機器ntpd不開啓
sh doCommand other "systemctl stop ntpd.service;/usr/sbin/ntpdate HD-2-101;"

2. 集羣規劃

集羣角色分佈

3. 配置Zookeeper集羣

安裝包下載地址：zookeeper-3.4.14.tar.gzbootstrap

解壓zookeeper安裝包到/opt/cluster，並解壓

tar -zxvf /opt/cluster/zookeeper-3.4.14.tar.gz -C /opt/cluster;

sh doCommand all "mkdir -p /hdata/zookeeper;";

複製conf目錄下的zoo_sample.cfg爲zoo.cfg。並修改dataDir內容以下，追加server內容：

dataDir=/hdata/zookeeper server.1=HD-2-101:2888:3888 server.2=HD-2-102:2888:3888 server.3=HD-2-103:2888:3888 
#server.A=B:C:D。
#A是一個數字，表示這個是第幾號服務器；
#B是這個服務器的IP地址；
#C是這個服務器與集羣中的Leader服務器交換信息的端口；
#D是萬一集羣中的Leader服務器掛了，須要一個端口來從新進行選#舉，選出一個新的Leader，而這個端口就是用來執行選舉時服務器相互通訊的端口。
#集羣模式下配置一個文件myid，這個文件在dataDir目錄下，這個文件裏面有一個數據就是A的值，Zookeeper啓動時讀取此文件，拿到裏面的數據與zoo.cfg裏面的配置信息比較從而判斷究竟是哪一個server。

複製項目到其餘機器上。

sh xsync "/opt/cluster/zookeeper-3.4.14" "/opt/cluster";

全部機器zookeeper數據目錄下建立myid文件，文件中添加與server對應的編號。

# 如server.1=B:C:D
echo "1" > /hdata/zookeeper/myid;

建立軟鏈接。

sh doCommand all "ln -s /opt/cluster/zookeeper-3.4.14 /opt/cluster/zookeeper";

啓動集羣。

sh doCommand all "/opt/cluster/zookeeper/bin/zkServer.sh start";

檢查狀態

sh doCommand all "/opt/cluster/zookeeper/bin/zkServer.sh status";

4. HDFS-HA 與YARN-HA 集羣配置

4.1 修改env.sh配置

切換到/opt/cluster/hadoop/etc/hadoop路徑
hadoop-env.sh修改export JAVA_HOME=/opt/cluster/java
yarn-env.sh增長export JAVA_HOME=/opt/cluster/java
mapred-env.sh增長export JAVA_HOME=/opt/cluster/java

4.2 修改site.xml配置

上傳hadoop_template.tar.gz模版壓縮包到/home目錄下並解壓：tar -zxvf /home/hadoop_template.tar.gz -C /home
根據機器配置填寫env.sh export 導出的變量值。
sh /home/hadoop_template/ha/env.sh運行腳本，自動完成配置。
ha模板路徑/home/hadoop_template/ha，全部的模板文件配置以下：

4.2.1 core-site.xml.template

<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
    <!-- 把兩個NameNode的地址組裝成一個集羣mycluster -->
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://${HADOOP_CLUSTER_NAME}</value>
    </property>

    <!-- 指定hadoop運行時產生文件的存儲目錄 -->
    <property>
        <name>hadoop.tmp.dir</name>
        <value>${HADOOP_TMP_DIR}</value>
    </property>

    <property>
        <name>ha.zookeeper.quorum</name>
        <value>${HADOOP_ZOOKEEPERS}</value>
    </property>
    <!-- 防止使用start-dfs.sh journalnode未啓動NameNode鏈接不上journalnode沒法啓動 -->
    <property>
        <name>ipc.client.connect.max.retries</name>
        <value>100</value>
        <description>Indicates the number of retries a client will make to establisha server connection.
        </description>
    </property>
    <property>
        <name>ipc.client.connect.retry.interval</name>
        <value>10000</value>
        <description>Indicates the number of milliseconds a client will wait for before retrying to establish a server connection.
        </description>
    </property>
</configuration>

4.2.2 hdfs-site.xml.template

<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
    <!-- 徹底分佈式集羣名稱 -->
    <property>
        <name>dfs.nameservices</name>
        <value>${HADOOP_CLUSTER_NAME}</value>
    </property>

    <!-- 集羣中NameNode節點都有哪些 -->
    <property>
        <name>dfs.ha.namenodes.${HADOOP_CLUSTER_NAME}</name>
        <value>${HADOOP_NAME_NODES}</value>
    </property>

    <!-- nn1的RPC通訊地址 -->
    <property>
        <name>dfs.namenode.rpc-address.${HADOOP_CLUSTER_NAME}.nn1</name>
        <value>${HADOOP_NN1}:9000</value>
    </property>

    <!-- nn2的RPC通訊地址 -->
    <property>
        <name>dfs.namenode.rpc-address.${HADOOP_CLUSTER_NAME}.nn2</name>
        <value>${HADOOP_NN2}:9000</value>
    </property>

    <!-- nn1的http通訊地址 -->
    <property>
        <name>dfs.namenode.http-address.${HADOOP_CLUSTER_NAME}.nn1</name>
        <value>${HADOOP_NN1}:50070</value>
    </property>

    <!-- nn2的http通訊地址 -->
    <property>
        <name>dfs.namenode.http-address.${HADOOP_CLUSTER_NAME}.nn2</name>
        <value>${HADOOP_NN2}:50070</value>
    </property>

    <!-- 指定NameNode元數據在JournalNode上的存放位置 -->
    <property>
        <name>dfs.namenode.shared.edits.dir</name>
    <value>${HADOOP_JN}</value>
    </property>

    <!-- 配置隔離機制，即同一時刻只能有一臺服務器對外響應 -->
    <property>
        <name>dfs.ha.fencing.methods</name>
        <value>sshfence</value>
    </property>

    <!-- 使用隔離機制時須要ssh無祕鑰登陸-->
    <property>
        <name>dfs.ha.fencing.ssh.private-key-files</name>
        <value>${HADOOP_ISA_PATH}</value>
    </property>

    <!-- 聲明journalnode服務器存儲目錄-->
    <property>
        <name>dfs.journalnode.edits.dir</name>
        <value>${HADOOP_JN_DATA_DIR}</value>
    </property>

    <!-- 關閉權限檢查-->
    <property>
        <name>dfs.permissions.enable</name>
        <value>false</value>
    </property>

    <!-- 訪問代理類：client，mycluster，active配置失敗自動切換實現方式-->
    <property>
        <name>dfs.client.failover.proxy.provider.${HADOOP_CLUSTER_NAME}</name>
    <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
    </property>

    <property>
        <name>dfs.ha.automatic-failover.enabled</name>
        <value>true</value>
    </property>
</configuration>

4.2.3 yarn-site.xml.template

<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>

    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>

    <!--啓用resourcemanager ha-->
    <property>
        <name>yarn.resourcemanager.ha.enabled</name>
        <value>true</value>
    </property>
 
    <!--聲明兩臺resourcemanager的地址-->
    <property>
        <name>yarn.resourcemanager.cluster-id</name>
        <value>${HADOOP_YARN_ID}</value>
    </property>

    <property>
        <name>yarn.resourcemanager.ha.rm-ids</name>
        <value>${HADOOP_YARN_RMS}</value>
    </property>

    <property>
        <name>yarn.resourcemanager.hostname.rm1</name>
        <value>${HADOOP_YARN_RM1}</value>
    </property>

    <property>
        <name>yarn.resourcemanager.hostname.rm2</name>
        <value>${HADOOP_YARN_RM2}</value>
    </property>
 
    <!--指定zookeeper集羣的地址--> 
    <property>
        <name>yarn.resourcemanager.zk-address</name>
        <value>${HADOOP_ZOOKEEPERS}</value>
    </property>

    <!--啓用自動恢復--> 
    <property>
        <name>yarn.resourcemanager.recovery.enabled</name>
        <value>true</value>
    </property>
 
    <!--指定resourcemanager的狀態信息存儲在zookeeper集羣--> 
    <property>
        <name>yarn.resourcemanager.store.class</name>
        <value>org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore</value>
</property>

</configuration>

4.2.4 mapred-site.xml.template

<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>

    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>

</configuration>

4.2.5 env.sh腳本

#!/bin/bash
# hadoop安裝目錄
export HADOOP_HOME="/opt/cluster/hadoop-2.7.2"
#
# hadoop集羣名稱
export HADOOP_CLUSTER_NAME="myhadoop"
# hadoop運行時產生文件的存儲目錄
export HADOOP_TMP_DIR="/hdata/hadoop"
#
# 集羣中全部NameNode節點
export HADOOP_NAME_NODES="nn1,nn2"
# 根據上面列出的NameNode配置全部NameNode節點地址，變量名稱如HADOOP_NN1,HADOOP_NN2依次增長
export HADOOP_NN1="HD-2-101"
export HADOOP_NN2="HD-2-102"
# NameNode元數據在JournalNode上的存放位置
export HADOOP_JN="qjournal://HD-2-101:8485;HD-2-102:8485;HD-2-103:8485/myhadoop"
# id_rsa公鑰地址
export HADOOP_ISA_PATH="~/.ssh/id_rsa"
# journalnode服務器存儲目錄
export HADOOP_JN_DATA_DIR="/hdata/hadoop/journal"
# zookeeper機器列表
export HADOOP_ZOOKEEPERS="HD-2-101:2181,HD-2-102:2181,HD-2-103:2181"
# yarn集羣id
export HADOOP_YARN_ID="yarn-ha"
# 集羣中全部的resourcemanager
export HADOOP_YARN_RMS="rm1,rm2"
# 根據上面列出的resourcemanager配置全部resourcemanager節點地址，變量名稱如HADOOP_YARN_RM1,HADOOP_YARN_RM2依次增長
export HADOOP_YARN_RM1="HD-2-101"
export HADOOP_YARN_RM2="HD-2-102"

baseDir=$(cd `dirname $0`; pwd)
for template in `cd ${baseDir}; ls *template`
do
    siteFile=`echo ${template} | gawk -F"." '{print $1"."$2}'`
    envsubst < ${template} > ${HADOOP_HOME}/etc/hadoop/${siteFile}
    echo -e "#### set ${siteFile} succeed"
done

5. 集羣啓動

5.1 hdfs啓動

同步配置到其餘機器

# 同步
sh xsync "/opt/cluster/hadoop-2.7.2" "/opt/cluster";
# 創建軟鏈接
sh doCommand all "ln -s /opt/cluster/hadoop-2.7.2 /opt/cluster/hadoop;";

啓動zk集羣並初始化在ZK中的狀態

# 啓動zk集羣
sh doCommand all "source /etc/profile; /opt/cluster/zookeeper/bin/zkServer.sh start";
# 初始化在ZK中的狀態
sh /opt/cluster/hadoop/bin/hdfs zkfc -formatZK

啓動journalnode

sh doCommand all "sh /opt/cluster/hadoop/sbin/hadoop-daemon.sh start journalnode";

登陸NameNode1機器上格式化並啓動

# 格式化
sh /opt/cluster/hadoop/bin/hdfs namenode -format;
# 啓動
sh /opt/cluster/hadoop/sbin/hadoop-daemon.sh start namenode;

登陸NameNode2機器同步nn1元數據，並啓動

# 同步元數據
sh /opt/cluster/hadoop/bin/hdfs namenode -bootstrapStandby;
# 啓動NameNode2
sh /opt/cluster/hadoop/sbin/hadoop-daemon.sh start namenode;

Web界面顯示NameNode信息

HD-2-101

HD-2-102

重啓全部dfs全部服務，除了zk

sh /opt/cluster/hadoop/sbin/stop-dfs.sh
sh /opt/cluster/hadoop/sbin/start-dfs.sh

檢查全部機器NameNode狀態

# 檢查狀態
sh /opt/cluster/hadoop/bin/hdfs haadmin -getServiceState nn1;
sh /opt/cluster/hadoop/bin/hdfs haadmin -getServiceState nn2;

5.2 yarn啓動

HD-2-101啓動yarn

sh /opt/cluster/hadoop/sbin/start-yarn.sh;

HD-2-103啓動ResourceManager

sh /opt/cluster/hadoop/sbin/yarn-daemon.sh start resourcemanager;

查看ResourceManager服務狀態

sh /opt/cluster/hadoop/bin/yarn rmadmin -getServiceState rm1;
sh /opt/cluster/hadoop/bin/yarn rmadmin -getServiceState rm2;

集羣狀態

yarn HD-2-101狀態

yarn HD-2-102狀態

6. 環境驗證

建立文件word.txt，內容以下：

export	HADOOP_CLUSTER_NAME	myhadoop
export	HADOOP_TMP_DIR	hdata	hadoop
hdata	export
HADOOP_TMP_DIR	myhadoop	export

建立文件到指定路徑

# 建立路徑
/opt/cluster/hadoop/bin/hadoop fs -mkdir -p /mapreduce/test/input/20180702;
# 上傳
/opt/cluster/hadoop/bin/hadoop fs -put ./word.txt /mapreduce/test/input/20180702;

測試運行wordcount

cd /opt/cluster/hadoop;
bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount /mapreduce/test/input/20180702 /mapreduce/test/output/20180702;