CDH6.2離線安裝(整理版)

1.概述

  CDH,全稱Cloudera's Distribution, including Apache Hadoop。是Hadoop衆多分支中對應中的一種,由Cloudera維護,基於穩定版本的Apache Hadoop構建,提供了Hadoop的核心(可擴展存儲、分佈式計算),最爲重要的是提供基於web的用戶界面。html

  CDH的優勢:版本劃分清晰,更新速度快,支持Kerberos安全認證,支持多種安裝方式(如Yum、rpm等)。java

  CDH分爲Cloudera Manager管理平臺和CDH parcel(parcel包含各類組件的安裝包)。這裏採用CDH6.2.0。node

  Cloudera Manger下載地址爲https://archive.cloudera.com/cm6/6.2.0/redhat7/yum/RPMS/x86_64/,如圖:mysql

  

   CDH6.2.0安裝包地址爲:https://archive.cloudera.com/cdh6/6.2.0/parcels/linux

   因爲操做系統爲CentOS7,須要下載如下文件:web

  

  上述文件整理資料百度雲下載地址爲:sql

  連接: https://pan.baidu.com/s/1Dm5Elf9uQqn14BUbgU3AFQ 提取碼: mws3 數據庫

2. 安裝步驟

說明:如下操做都是在root用戶下進行的vim

2.1 環境準備

2.1.1. 準備虛擬機(根據本身的系統資源分配虛擬機資源)

2.1.2. 靜態IP設置(每一個節點)

vim /etc/sysconfig/network-scripts/ifcfg-ens192安全

service network restart 重啓網絡生效

yum install -y net-tools ifconfig查看設置

2.1.3. 編輯/etc/hosts文件(每一個節點)

vim /etc/hosts

2.1.4. 關閉防火牆、禁止防火牆開機自啓(每一個節點)

  • systemctl stop firewalld 關閉防火牆
  • systemctl disable firewalld 禁止防火牆開機自啓
  • vim /etc/selinux/config —> SELINUX=disabled (修改)

2.1.5. ssh無密碼登陸

  • manager節點執行ssh-keygen -t rsa 一路回車到結束,在/root/.ssh/下面會生成一個公鑰文件id_rsa.pub
  • cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys 將公鑰追加到authorized_keys
  • chmod 600 ~/.ssh/authorized_keys 修改權限
  • 將~/.ssh從當前節點分發到其餘各個節點。如:scp -r ~/.ssh/ root@node1:~/.ssh/
  • ssh 各個節點互相登錄

2.1.6. 配置NTP服務(全部節點)

  • 修改時區(改成中國標準時區)ln -sf /usr/share/zoneinfo/Asia/Shanghai /etc/localtime
  • 安裝ntp yum -y install ntp
  • ntp主機配置 vim /etc/ntp.conf
  • manager節點

其他節點

  • 從新啓動 ntp 服務:service ntpd restart
  • 設置開機自啓:systemctl enable ntpd.service
  • ntpdc -c loopinfo #查看與時間同步服務器的時間誤差
  • ntpq -p #查看當前同步的時間服務器
  • ntpstat #查看狀態
  • 配置成功狀態(服務開啓後前面出現*說明成功):

2.1.7. 修改Linux swappiness參數(全部節點)

爲了不服務器使用swap功能而影響服務器性能,通常都會把vm.swappiness修改成0(cloudera建議10如下)

  • 上述方法rhel6有效,rhel7.2中:tuned服務會動態調整系統參數
  • 查找tuned中配置,直接修改配置
  • cd /usr/lib/tuned/
  • grep 「vm.swappiness」 * -R 查詢出後依次修改

修改完確認:

參考:sysctl修改內核參數 重啓不生效 https://blog.csdn.net/ygtlovezf/article/details/79014299

2.1.8. 禁用透明頁(全部節點)

echo never > /sys/kernel/mm/transparent_hugepage/defrag
echo never > /sys/kernel/mm/transparent_hugepage/enabled
永久生效 在/etc/rc.local 添加上面命令

給與可執行權限:chmod +x /etc/rc.d/rc.local

2.1.9. JDK安裝(全部節點)

  • rpm -qa | grep java # 查詢已安裝的java
  • yum remove java* # 卸載
  • rpm -ivh oracle-j2sdk1.8-1.8.0+update181-1.x86_64.rpm
  • vi /etc/profile 末尾添加

  • source /etc/profile
  • java -version驗證

2.1.10. 建立/usr/share/java目錄,將mysql-jdbc包放過去(全部節點)

  • mkdir -p /usr/share/java
  • mv /opt/mysql-j/mysql-connector-java-5.1.34.jar /usr/share/java/
  • mysql-connector-java-5.1.34.jar 必定要命名爲mysql-connector-java.jar

2.1.11. 爲保證防火牆、虛擬機參數修改後生效,各節點機器須要重啓 reboot

2.1.12. Mysql安裝

  • 卸載mariadb:rpm -qa|grep mariadb
  • rpm -e --nodeps mariadb-libs-5.5.60-1.el7_5.x86_64
  • cd /opt/mysql/
  • tar -xvf ./mysql-5.7.19-1.el7.x86_64.rpm-bundle.tar
  • rpm -ivh mysql-community-common-5.7.19-1.el7.x86_64.rpm
  • rpm -ivh mysql-community-libs-5.7.19-1.el7.x86_64.rpm
  • rpm -ivh mysql-community-client-5.7.19-1.el7.x86_64.rpm
  • rpm -ivh mysql-community-server-5.7.19-1.el7.x86_64.rpm
  • rpm -ivh mysql-community-libs-compat-5.7.19-1.el7.x86_64.rpm
  • MYSQL配置:
  • mysqld --initialize --user=mysql # 初始化mysql使mysql目錄的擁有者爲mysql用戶
  • cat /var/log/mysqld.log # 最後一行將會有隨機生成的密碼
  • systemctl start mysqld.service # 設置mysql服務自啓
  • mysql -uroot –p 若是不能登錄
  • 設置免密登陸並重啓mysql服務
  • vi /etc/my.cnf
  • systemctl restart mysqld
  • #登陸

    $>mysql -u root
    mysql>use mysql;
    mysql>update user set authentication_string = password(‘123456’), password_expired = ‘N’, password_last_changed = now() where user = ‘root’;
    mysql>exit;

  • 建立庫(後續安裝服務等使用)

2.1.13. 安裝Httpd服務(manager)

  • yum install httpd
  • service httpd start
  • systemctl enable httpd.service 設置httpd服務開機自啓

2.1.14. 防止出現莫名錯誤,事先安裝如下插件(全部節點)

  • yum install cloudera-manager-daemons cloudera-manager-agent cloudera-manager-server --skip-broken --nogpgcheck

2.1.15. 配置Cloudera Manager包yum源(manager節點)

  • mkdir -p /var/www/html/cloudera-repos/
  • 將下載的cm包文件移到此目錄下:
  • mv cm6 /var/www/html/cloudera-repos/
  • cd /var/www/html/cloudera-repos/cm6/
  • 建立repodata: createrepo .

  • vim /etc/yum.repos.d/cloudera-manager.repo

  注意路徑:http://manager/cloudera-repos/cm6/

  • yum clean all
  • yum makecache

2.1.16.導入GPG key(若是沒有這步操做,極可能cloudera服務安裝失敗)manager節點

  • rpm --import https://archive.cloudera.com/cm6/6.2.0/redhat7/yum/RPM-GPG-KEY-cloudera

2.1.17. 安裝 Cloudera Manager(manager節點)

  • sudo yum install cloudera-manager-daemons cloudera-manager-agent cloudera-manager-server
  • 安裝完CM後/opt/ 下會出現cloudera目錄
  • mv /opt/parcels/* /opt/cloudera/parcel-repo # 將parcel包移動到指定位置
  • 在/opt/cloudera/parcel-repo執行如下命令:
  • sha1sum CDH-6.2.0-1.cdh6.2.0.p0.967373-el7.parcel | awk ‘{ print $1 }’ > CDH-6.2.0-1.cdh6.2.0.p0.967373-el7.parcel.sha

  • 執行初始化腳本:
  • /opt/cloudera/cm/schema/scm_prepare_database.sh mysql cmserver cmserveruser password
  • 打開server服務:
  • service cloudera-scm-server start
  • 靜候幾分鐘,打開http://manager:7180

2.2 其餘服務安裝

2.2.1 登陸cm WEB界面

http://主機ip:7180/cmf/login 訪問CM
用戶名admin
密碼admin
遇到問題:7180服務沒有啓動
解決方法:

查看端口服務,未啓動

cm服務啓動顯示正常。
我在剛啓動服務後7180沒有啓動,沒找到什麼緣由,後來 晾了它一夜,次日一查端口,竟然啓動了,多是cm服務要啓動的東西太多,主機一時沒啓動。

啓動成功!

備註:
linux查看端口:http://www.javashuo.com/article/p-mpdxexii-kd.html

2.2.2 具體安裝步驟

WELCOME

 

 Accept License

Select Edition

版本選擇免費版,已經夠用。

Welcome (Add Cluster - Installation)

Specify Hosts

主機是本身規劃安裝agent的主機

Select Repository

JDK 安裝選項

Enter Login Credentials

Install Agents

最到考驗網速的時候了,該頁面使用js進行刷新,千萬別手動刷新,手動刷新的話安裝列表中以前已經功成的會消失,未成功的顯示,未成功即便安裝成功了,cm會管理不到以前已經成功但刷新後未顯示的主機,在安裝集羣時只能選擇本次顯示的(緣由未知)。網速過慢的話安裝會失敗,必定要耐心等待,別作無關操做。

失敗重試直到成功,再次說明,耐心等待。

n次失敗以後終於安裝成功!

Install Parcels

安裝成功!等了有將近半天的時候。。。

Inspect Hosts

問題處理:
時鐘同步是因爲我恢復過一次鏡像,在手動同步一下便可。
服務端啓動(恢復鏡像竟然沒啓動)

各臺同步

虛擬內存設置:
Cloudera 建議將 /proc/sys/vm/swappiness 設置爲0-10。當前設置爲 30。使用 sysctl 命令在運行時更改該設置並編輯 /etc/sysctl.conf,以在重啓後保存該設置。您能夠繼續進行安裝,但 Cloudera Manager 可能會報告您的主機因爲交換而運行情況不良。如下主機將受到影響:

查看詳細信息
cdh[171-174]
解決:
臨時解決
經過echo 10 > /proc/sys/vm/swappiness便可解決。
永久解決
sysctl -w vm.swappiness=10
echo vm.swappiness = 10 >> /etc/sysctl.conf

透明大頁問題:
已啓用透明大頁面壓縮,可能會致使重大性能問題。請運行「echo never > /sys/kernel/mm/transparent_hugepage/defrag」和「echo never > /sys/kernel/mm/transparent_hugepage/enabled」以禁用此設置,而後將同一命令添加到 /etc/rc.local 等初始化腳本中,以便在系統重啓時予以設置。如下主機將受到影響:
查看詳細信息
cdh[171-174]
處理:
大內存頁禁用
echo never>/sys/kernel/mm/transparent_hugepage/defrag
echo never>/sys/kernel/mm/transparent_hugepage/enabled

升級軟件依賴版本
Starting with CDH 6, PostgreSQL-backed Hue requires the Psycopg2 version to be at least 2.5.4, see the documentation for more information. This warning can be ignored if hosts will not run CDH 6, or will not run Hue with PostgreSQL. The following hosts have an incompatible Psycopg2 version of ‘2.5.1’:
查看詳細信息
cdh[171-174]
本次忽略
處理完成:

 

2.3 大數據組件安裝

正式安裝前拍個快照

Select Services

自定義角色分配

數據庫設置

這裏測試了一夜。。。

審覈更改(能夠本身更改目錄,我使用的是默認)

cdh管理界面,大功告成:

第一次進入後,許多服務標紅,查看後是agent與cm失去鏈接。
#ntpstat(全部節點)
只有cm啓動,其他莫名中止。
#systemctl start ntpd(中止節點)
#ntpdate -u cdh1(ntp服務端)
在失去的節點 執行
service cloudera-scm-agent restart(中止節點)
重啓 正常啓動不報錯

service cloudera-scm-agent status(查看 agent 狀態)

總結

【參考資料】

https://blog.csdn.net/wolf_333/article/details/89071203

http://www.cnblogs.com/mylovelulu/p/10384732.html

https://blog.csdn.net/qq_40127822/article/details/84441869

https://www.cnblogs.com/raphael5200/p/5293960.html

相關文章
相關標籤/搜索