Cloudera Certified Associate Administrator案例之Configure篇

     Cloudera Certified Associate Administrator案例之Configure篇
node

                                      做者:尹正傑後端

版權聲明:原創做品,謝絕轉載!不然將追究法律責任。服務器

 

 

一.下載CDH集羣中最新的配置文件oop

問題描述:
  某個集羣的使用者須要經過客戶端登錄集羣,請使用CM下載HDFS和YARN的配置文件,保存到客戶端機器的"/home/yinzhengjie/hadoop/etc/hadoop"目錄下,並保持文件名不變。

解決方案:
  能夠經過登錄CM WebUI界面下載,也能夠直接登錄服務器進行下載。

1>.使用正確的用戶名密碼登陸CM界面,點擊hdfs服務spa

2>. 下載HDFS的配置文件3d

 

3>.使用正確的用戶名密碼登陸CM界面,點擊yarn服務日誌

4>.下載YARN服務的配置文件code

5>.查看集羣后端存儲配置文件的路徑xml

[root@node101.yinzhengjie.org.cn ~]# ll /etc/hadoop/conf.cloudera.hdfs/        #HDFS集羣存儲路徑
total 36
-rw-r--r-- 1 root root   19 Jun 14 12:27 __cloudera_generation__
-rw-r--r-- 1 root root   66 Jun 14 12:27 __cloudera_metadata__
-rw-r--r-- 1 root root 3556 Jun 14 12:27 core-site.xml
-rw-r--r-- 1 root root 2696 Jun 14 12:27 hadoop-env.sh
-rw-r--r-- 1 root root 1786 Jun 14 12:27 hdfs-site.xml
-rw-r--r-- 1 root root  314 Jun 14 12:27 log4j.properties
-rw-r--r-- 1 root root  315 Jun 14 12:27 ssl-client.xml
-rw-r--r-- 1 root root  634 Jun 14 12:27 topology.map
-rwxr-xr-x 1 root root 1594 Jun 14 12:27 topology.py
[root@node101.yinzhengjie.org.cn ~]# 
[root@node101.yinzhengjie.org.cn ~]# 
[root@node101.yinzhengjie.org.cn ~]# 
[root@node101.yinzhengjie.org.cn ~]# ll /etc/hadoop/conf.cloudera.yarn/      #YARN集羣存儲路徑
total 48
-rw-r--r-- 1 root root     21 Jun 14 12:42 __cloudera_generation__
-rw-r--r-- 1 root root     66 Jun 14 12:42 __cloudera_metadata__
-rw-r--r-- 1 root root   3869 Jun 14 12:42 core-site.xml
-rw-r--r-- 1 root root    617 Jun 14 12:42 hadoop-env.sh
-rw-r--r-- 1 root root   1786 Jun 14 12:42 hdfs-site.xml
-rw-r--r-- 1 root root    314 Jun 14 12:42 log4j.properties
-rw-r--r-- 1 root root   5154 Jun 14 12:42 mapred-site.xml
-rw-r--r-- 1 root root    315 Jun 14 12:42 ssl-client.xml
-rw-r--r-- 1 root hadoop  634 Jun 14 16:41 topology.map
-rwxr-xr-x 1 root hadoop 1594 Jun 14 16:41 topology.py
-rw-r--r-- 1 root root   3653 Jun 14 12:42 yarn-site.xml
[root@node101.yinzhengjie.org.cn ~]# 
[root@node101.yinzhengjie.org.cn ~]# 

 

二.限制HDFS服務的日誌大小blog

問題描述:
  根據管理要求,須要限制HDFS服務的日誌大小。其限制爲:NameNode服務保留4個日誌文件,總量不超過8GB;Secondary NameNode 服務也保留4個日誌文件,總量不超過8GB;兩個服務總佔用的磁盤空間 量不超過16GB。

解決方案:
  單個服務的單個日誌只要不超 過2GB,並將日誌數設爲4個,便可以知足要求。 

1>.使用正確的用戶名密碼登陸CM界面,點擊hdfs服務

2>.搜索關鍵字「NameNode Max Log Size」

3>.修改默認值200MB爲2GB並點擊保存按鈕

4>.搜索關鍵字「SecondaryNameNode Max Log Size」(中文對應:"SecondaryNameNode 最大日誌文件備份")

5>.修改日誌文件的備份數爲4

6>.重啓HDFS服務 

 

三.修改Namenode的堆內存

問題描述:
    集羣承接了日誌分析需求,將保存百萬、千萬數量級的文件,因 此須要擴大NameNode使用的堆內存,使其能夠管理儘量多的文件。物理內存的分配要求爲:節點總物理內存爲31GB,爲系統服務保留的內存爲6.2GB;NameNode和Secondary NameNode需設置相等大小的堆內存; 全部服務的堆內存均須要乘以1.3後計入總使用量中。須要爲NameNode和相關服務配置儘量大且知足要求的內存量,且不能觸發任何警告。

解決方案:
  根據計算(31 - 6.2) / 1.3 = 19,所以 NameNode和Secondary NameNode各可設置9.5GB的堆內存。 

1>.使用正確的用戶名密碼登陸CM界面,點擊hdfs服務

2>.點擊配置,搜索關鍵字「Java Heap Size of NameNode in Bytes」(對應中文爲:"NameNode 的 Java 堆棧大小(字節)")

3>.設置NameNode和SencondName的堆內存爲9.5GB

 

4>.重啓HDFS集羣(須要注意的是,若是咱們設置的NameNode或者SecondNamenode的堆內存大小總和大於當前服務器內存時,咱們在重啓集羣時會啓動失敗!)

 

四.

 

 

 

五.

相關文章
相關標籤/搜索