centos6.4用cloudera manager安裝hadoop2.0.0-cdh4.3.0集羣(一)html
cloudera 發行的hadoop安裝有4種方式,其中使用cloudera manager安裝是最簡單的。缺點是你不清楚hadoop安裝時的配置以及具體流程,並且cloudera manager的商業版是收費的,有免費版可是隻支持最多50個節點。雖然官方極力推薦此種方法,可是我的認爲若須要對hadoop源碼熟悉的較快,能夠 選擇手動安裝。下面簡單介紹一下cloudera安裝方式的流程。java
1、前期準備linux
一、操做系統選擇。sql
centos、red hat、ubuntu均是能夠的,可是和要安裝的hadoop版本有區別。根據要安裝的hadoop選擇操做系統,通常選centos6以上版本。數據庫
二、jdk安裝配置ubuntu
選擇jdk1.7以上版本,集羣安裝最好全部節點版本一致,路徑一致。下載地址:http://www.oracle.com/technetwork/java/javase/downloads/jdk7-downloads-1880260.htmlvim
將已下載的java包移動到你想要的目錄,好比:centos
cd /usr網絡
mkdir java併發
mv 'java源包路徑' 、/usr/java
rpm -ivh /usr/java/java1.7.....
安裝完成後,須要配置環境變量:
export JAVA_HOME=<jdk-install-dir>
sudo env | grep JAVA_HOME
編輯/etc/sudoers文件:
vim /etc/sudoers
按i編輯,添加:
Defaults env_keep+=JAVA_HOME
esc退出編輯,輸入‘:wq!’保存退出。
三、關閉selinux
vim /etc/selinux/config
修改SELINUX=disabled
注:重啓後生效,能夠在配置完其餘步驟後再重啓。
四、關閉防火牆
service iptables stop ---臨時關閉
chkconfig iptables stop ---永久關閉
不一樣系統有細微區別,建議每次開機都臨時關閉防火牆,永久關閉命令不必定有效。
五、配置代理以及修改timeout
vim /etc/yum.conf
添加:
http_proxy=http://server:port/
timeout=55555
此處timeout若不添加可能會在後續cdh4安裝時由於網絡問題下載安裝失敗。
六、安裝內置數據庫postgresql
yum install postgresql
service postgresql initdb ---此處數據庫初始化注意必須在操做系統中添加有PostgreSQL
chkconfig postgresql on ---開機啓動
vim /var/lib/pgsql/data/postgresql.conf ---配置參數
修改
#listen_addresses = '127.0.0.1' # what IPaddress(es) to listen on;
# comma-separatedlist of addresses;
#defaults to 'localhost', '*' = all
#port = 5432
修改後:
listen_addresses= '*' #what IP address(es) to listen on;
# comma-separated listof addresses;
# defaults to'localhost', '*' = all
port= 5432
保存退出。
service postgresql restart ---重啓數據庫服務
上述前期配置均已完成後可重啓計算機。全部集羣節點均作相同操做。
2、部署cdh4集羣
一、修改主機名
好比在master節點上:
hostname master
vim /etc/sysconfig/network
修改
HOSTNAME=master
其餘slave節點作相似操做,重啓計算機。
二、修改hosts
vim /etc/hosts
添加:
192.168.xxx.xxx master
192.168.xxx.xxx slave01
192.168.xxx.xxx slave02
..
..
全部集羣電腦作上述相同配置。
三、配置ssh
在Master上生成一個密鑰對,包括一個公鑰和一個私鑰,並將公鑰複製到全部的Slave上;
當Master經過SSH鏈接Slaver時,Slave會生成一個隨機數並用Master的公鑰對隨機數進行加密,併發送給Master;
Master收到加密後用私鑰進行解密,並將解密數回送給Slave,Slave確認解密數無誤後容許Master不輸入密碼就能夠進行鏈接。
在master電腦上:
ssh-keygen -t rsa -p ''
一路默認,按enter結束。若以前已有公鑰私鑰,會出現是否覆蓋,y肯定覆蓋。
cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
chmod 600 ~/.ssh/authorized_keys
vim /etc/ssh/sshd_config
修改
#RSAAuthentication yes # 啓用RSA 認證
#PubkeyAuthentication yes # 啓用公鑰私鑰配對認證方式
# AuthorizedKeysFile .ssh/authorized_keys # 公鑰文件路徑(和上面生成的文件同)
修改後:
RSAAuthenticationyes # 啓用RSA 認證
PubkeyAuthenticationyes # 啓用公鑰私鑰配對認證方式
AuthorizedKeysFile.ssh/authorized_keys # 公鑰文件路徑(和上面生成的文件同)