hadoop優化

時間 2020-01-24

標籤 hadoop 優化欄目 Hadoop 简体版

原文原文鏈接

配置 dfs.data.dir，將其值配置爲多塊磁盤linux

<key>dfs.data.dir</key>app

<value>/data/data1,/data/data2,/data/data3</value>ide

####假設多塊磁盤被掛在以上目錄中oop

2. mapreduce中間數據臨時文件分散寫server

老的配置參數爲，mapred.local.dir，新配置待查。進程

3. 以noatime和nodiratime方式裝載磁盤內存

#atime：linux中文件在建立、修改、訪問的時候會更新時間信息，是一筆很大的資源開銷。hadoop

#diratime：每一次訪問須要更新inode在文件系統中的訪問時間。ci

設置：

#1:卸載磁盤

#2：修改

vi /etc/fstab

/dev/xvdc /mnt/is1 ext3 defaults,noatime,nodiratime 0 0

/dev/xvdd /mnt/is2 ext3 defaults,noatime,nodiratime 0 0

#3：從新掛載

4. 取消特權塊空間

默認狀況下，會保留一些文件塊供特權進程使用，爲防止用戶進程將空間佔滿，使得系統進程餓死。

由於咱們的集羣就是使用hadoop，因此能夠下降這些塊的百分比。

5. vm.swappiness

該參數用來定義將內存頁交換到磁盤中的主動程序，值越低表示交換頻率越低。

若是交換頻率太高，會致使regionserver進程由於zookeeper會話超時而被強制終止。

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。