hadoop優化

  1. hadoop 分散磁盤I/Onode

    配置 dfs.data.dir,將其值配置爲多塊磁盤linux

    <key>dfs.data.dir</key>app

    <value>/data/data1,/data/data2,/data/data3</value>ide

    ####假設多塊磁盤被掛在以上目錄中oop

2.  mapreduce中間數據臨時文件分散寫server

    老的配置參數爲,mapred.local.dir,新配置待查。進程

3.  以noatime和nodiratime方式裝載磁盤內存

    #atime:linux中文件在建立、修改、訪問的時候會更新時間信息,是一筆很大的資源開銷。hadoop

    #diratime:每一次訪問須要更新inode在文件系統中的訪問時間。ci


    設置:

    #1:卸載磁盤

    #2:修改

    vi /etc/fstab

    /dev/xvdc  /mnt/is1  ext3  defaults,noatime,nodiratime 0 0

    /dev/xvdd  /mnt/is2  ext3  defaults,noatime,nodiratime 0 0

    #3:從新掛載


4.  取消特權塊空間

    默認狀況下,會保留一些文件塊供特權進程使用,爲防止用戶進程將空間佔滿,使得系統進程餓死。

    由於咱們的集羣就是使用hadoop,因此能夠下降這些塊的百分比。


5.  vm.swappiness

    該參數用來定義將內存頁交換到磁盤中的主動程序,值越低表示交換頻率越低。

    若是交換頻率太高,會致使regionserver進程由於zookeeper會話超時而被強制終止。

相關文章
相關標籤/搜索