本文介紹Hadoop YARN最近版本中增長的幾個很是有用的特性,包括:html
(1)ResourceManager HAnode
在apache hadoop 2.4或者CDH5.0.0版本以後,增長了ResourceManger HA特性,支持基於Zookeeper的熱主備切換,具體配置參數能夠參考Cloudera的文檔:ResourceManager HA配置。apache
須要注意的是,ResourceManager HA只完成了第一個階段的設計,即備ResourceManager啓動後,會殺死以前正在運行的Application,而後從共享存儲系統中讀取這些Application的元數據信息,並從新提交這些Application。啓動ApplicationMaster後,剩下的容錯功能就交給ApplicationMaster實現了,好比MapReduce的ApplicationMaster會不斷地將完成的任務信息寫到HDFS上,這樣,當它重啓時,能夠從新讀取這些日誌,進而只需從新運行那些未完成的任務。ResourceManager HA第二個階段的任務是,備ResourceManager接管主ResourceManager後,無需殺死那些正在運行的Application,讓他們像任何事情沒有發生同樣運行下去。app
(2) 磁盤容錯ide
在apache hadoop 2.4或者CDH5.0.0版本以後,增長了幾個對多磁盤很是友好地參數,這些參數容許YARN更好地使用NodeManager上的多塊磁盤,相關jira爲:YARN-1781,主要新增了三個參數:oop
yarn.nodemanager.disk-health-checker.min-healthy-disks:NodeManager上最少保證健康磁盤比例,當健康磁盤比例低於該值時,NodeManager不會再接收和啓動新的Container,默認值是0.25,表示25%;測試
yarn.nodemanager.disk-health-checker.max-disk-utilization-per-disk-percentage:一塊磁盤的最高使用率,當一塊磁盤的使用率超過該值時,則認爲該盤爲壞盤,再也不使用該盤,默認是100,表示100%,能夠適當調低;ui
yarn.nodemanager.disk-health-checker.min-free-space-per-disk-mb:一塊磁盤最少保證剩餘空間大小,當某塊磁盤剩餘空間低於該值時,將再也不使用該盤,默認是0,表示0MB。spa
(3)資源調度器設計
Fair Scheduler:Fair Scheduler增長了一個很是有用的新特性,容許用戶在線將一個應用程序從一個隊列轉移到另一個隊列,好比將一個重要做業從一個低優先級隊列轉移到高優先級隊列,操做命令是:bin/yarn application -movetoqueue appID -queue targetQueueName,相關jira爲:YARN-1721。
Capacity Scheduler:Capacity Scheduler中資源搶佔功能通過了充分的測試,能夠使用了。