CentOS7迷你版安裝部署hadoop高可用沒法自動切換角色解決辦法!

解決Hadoop HA集羣 NameNode 沒法自動故障轉移(切換active)

在學習 HA 自動化配置,按照hadoop官網:https://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-hdfs/HDFSHighAvailabilityWithQJM.html 配置,最後全部的節點都啓動正常。html

kill -9 進程號 殺死了當前處於active狀態的NameNode後,其餘的 Standby 狀態的NameNode 並無自動切換爲 Active狀態,並且重啓殺死的 NameNode 後,可能出現全部NameNode節點都變成了 Standby狀態的狀況,一個Active狀態的都沒有。java

查看日誌:${HADOOP_HOME}/logs/hadoop-root-zkfc-hadoop2.log ,發現報錯了apache

2020-01-03 19:21:13,636 WARN org.apache.hadoop.ha.FailoverController: Unable to gracefully make NameNode at hadoop3/192.168.137.13:8020 standby (unable to connect)ssh

java.net.ConnectException: Call From hadoop2/192.168.137.12 to hadoop3:8020 failed on connection exception: java.net.ConnectException: 拒絕鏈接; For more details see:  http://wiki.apache.org/hadoop/ConnectionRefuseoop

at sun.reflect.GeneratedConstructorAccessor8.newInstance(Unknown Source學習

at sun.reflect.DelegatingConstructorAccessorImpl.newInstance(DelegatingConstructorAccessorImpl.java:45)spa

at java.lang.reflect.Constructor.newInstance(Constructor.java:423.net

at org.apache.hadoop.net.NetUtils.wrapWithMessage(NetUtils.java:792)日誌

 

這是由於沒有 fuster 程序,致使沒法進行 fence,根據官網上的配置,是在 hdfs-ite.xml 中配置過相關配置:xml

<property>

    <name>dfs.ha.fencing.methods</name>

    <value>sshfence</value>

</property>

解決方法:安裝包含fuster程序的軟件包Psmisc(每一個機器上都要安裝):

yum -y install psmisc

相關文章
相關標籤/搜索