有時候hadoop或hbase集羣運行時間久了後,某些節點就會失效,這個時候若是不想重啓整個集羣(這種狀況在不少狀況下已經不被容許),這個時候能夠單獨重啓失效節點。node
HADOOP:
hadoop中重啓單節點的方法和增長新節點實際上是同樣的。
一、咱們先看下如何瞭解hadoop機器的狀況,能夠用命令:
hadoop dfsadmin -report 查看集羣容量狀況,不少狀況下失效節點也能夠從這裏瞭解到(好比失效節點容量顯示爲0)。
二、重啓或添加節點:
$bin/hadoop-daemon.sh start datanode
$bin/hadoop-daemon.sh start tasktracker
固然,添加的話須要copy配置文件到新節點。重啓的話先
$bin/hadoop-daemon.sh stop datanode/
tasktracker
三、從新balancer(可選)
$bin/hadoop balancer
其實集羣本身會balancer,固然也能夠像上面那樣手動balancer,否則在繁忙時段最好避免。
HBASE:
不少時候,節點失效是由於pid文件被刪除引發(默認pid文件中/tmp下),因此最好把不少默認是/tmp的目錄修改爲本身的目錄,好比hbase的 pid配置能夠在hbase-env.sh中,修改export HBASE_PID_DIR=/var/hadoop/pids就能夠。hbase節點失效常對應60020端口異常。
進入hbase shell
一、查看節點狀況:
status
固然,也能夠經過web頁面查看(若是服務開放的話):
http://serviceIp:60010/master.jsp
http://serviceIp:60030/regionserver.jspweb
http://serviceIp:60010/zk.jspshell
二、重啓
$bin/hbase-daemon.sh stop regionserver
$bin/hbase-daemon.sh start regionserver
也能夠添加新的master(默認只有一個master),$bin/hbase-daemon.sh start master