day2-搭建hdfs分佈式集羣

時間 2019-11-12

標籤 day2 day 搭建 hdfs 分佈式集羣欄目 Hadoop 简体版

原文原文鏈接

一、搭建hdfs分佈式集羣

4.1 hdfs集羣組成結構：

4.2 安裝hdfs集羣的具體步驟：

1、首先須要準備N臺linux服務器java

學習階段，用虛擬機便可！node

先準備4臺虛擬機：1個namenode節點 + 3 個datanode 節點linux

2、修改各臺機器的主機名和ip地址web

主機名：hdp-01 對應的ip地址：192.168.33.61windows

主機名：hdp-02 對應的ip地址：192.168.33.62centos

主機名：hdp-03 對應的ip地址：192.168.33.63瀏覽器

主機名：hdp-04 對應的ip地址：192.168.33.64服務器

3、從windows中用CRT軟件進行遠程鏈接app

在windows中將各臺linux機器的主機名配置到的windows的本地域名映射文件中：dom

c:/windows/system32/drivers/etc/hosts

192.168.33.61 hdp-01

192.168.33.62 hdp-02

192.168.33.63 hdp-03

192.168.33.64 hdp-04

用crt鏈接上後，修改一下crt的顯示配置（字號，編碼集改成UTF-8）：

4、配置linux服務器的基礎軟件環境

l 防火牆

關閉防火牆：service iptables stop

關閉防火牆自啓： chkconfig iptables off

l 安裝jdk：（hadoop體系中的各軟件都是java開發的）

1) 利用alt+p 打開sftp窗口，而後將jdk壓縮包拖入sftp窗口

2) 而後在linux中將jdk壓縮包解壓到/root/apps 下

3) 配置環境變量：JAVA_HOME PATH

vi /etc/profile 在文件的最後，加入：

export JAVA_HOME=/root/apps/jdk1.8.0_60

export PATH=$PATH:$JAVA_HOME/bin

4) 修改完成後，記得 source /etc/profile使配置生效

5) 檢驗：在任意目錄下輸入命令： java -version 看是否成功執行

6) 將安裝好的jdk目錄用scp命令拷貝到其餘機器

7) 將/etc/profile配置文件也用scp命令拷貝到其餘機器並分別執行source命令

l 集羣內主機的域名映射配置

在hdp-01上，vi /etc/hosts

127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4

::1 localhost localhost.localdomain localhost6 localhost6.localdomain6

192.168.33.61 hdp-01

192.168.33.62 hdp-02

192.168.33.63 hdp-03

192.168.33.64 hdp-04

而後，將hosts文件拷貝到集羣中的全部其餘機器上

scp /etc/hosts hdp-02:/etc/

scp /etc/hosts hdp-03:/etc/

scp /etc/hosts hdp-04:/etc/

補充

提示:

若是在執行scp命令的時候，提示沒有scp命令，則能夠配置一個本地yum源來安裝

一、先在虛擬機中配置cdrom爲一個centos的安裝鏡像iso文件

二、在linux系統中將光驅掛在到文件系統中（某個目錄）

三、mkdir /mnt/cdrom

四、mount -t iso9660 -o loop /dev/cdrom /mnt/cdrom

五、檢驗掛載是否成功： ls /mnt/cdrom

六、三、配置yum的倉庫地址配置文件

七、yum的倉庫地址配置文件目錄： /etc/yum.repos.d

八、先將自帶的倉庫地址配置文件批量改名：

九、而後，拷貝一個出來進行修改

十、修改完配置文件後，再安裝scp命令：

十一、yum install openssh-clients -y

l 5、安裝hdfs集羣

一、上傳hadoop安裝包到hdp-01

二、修改配置文件

要點提示	*核心配置參數：* 1) 指定hadoop的默認文件系統爲：hdfs 2) 指定hdfs的namenode節點爲哪臺機器 3) 指定namenode軟件存儲元數據的本地目錄 4) 指定datanode軟件存放文件塊的本地目錄