YARN node labels

最近在作實驗,實驗須要進行分區域計算,網上查了資料後發現Yarn Node Labels + Capacity-Scheduler能夠實現個人需求node

可是當任務提交到capacity-scheduler調度器的default隊列時,任務卡在ACCEPTED階段。express

網上看了不少發現沒有這方面的信息,最後在Apache hadoop官網的官方手冊上查到有如下信息apache

property Value
yarn.scheduler.capacity.<queue-path>.default-node-label-expression Value like 「hbase」, which means: if applications submitted to the queue without specifying node label in their resource requests, it will use 「hbase」 as default-node-label-expression. By default, this is empty, so application will get containers from nodes without label.

從官網上說明來看,若是yarn.scheduler.capacity.<queue-path>.default-node-label-expression設置了value,那麼提交到queue中的任務若是沒有說明用什麼label,則使用這個value所定義的label;若是這個value爲空,那麼提交到這個隊列的任務只能在不含有label的node上執行。此處的value只能是一個label,不能是多個label。app

也就是說yarn node label中的queue只能默認使用一個label,不能多label使用,若是某個queue沒有指定label,那麼該queue中job只能在沒有label的node上執行。oop

個人實驗環境中全部的nodemanager都設置了yarn node labels,yarn.scheduler.capacity.root.default.default-node-label-expression=' ',因此當我任務提交到capacity-scheduler調度器的default隊列時,任務卡在ACCEPTED階段,由於沒有不綁定label的節點,因此任務卡在了accepted了。this

下面說下個人實驗環境及需求spa

個人需求:code

個人capacity-scheduler.xml文件中配置:yarn.scheduler.capacity.root.default.default-node-label-expression=' 'server

上圖中default queue隊列不能在Host1,Host2,Host3上運行,由於Host1,Host2,Host3都有Node-label。xml

根據以上需求,我配置文件以下:

在yarn-site.xml中開啓capacity-schedule

<property>
    <name>yarn.resourcemanager.scheduler.class</name>
    <value>org.apache.hadoop.yarn.server.resourcemanager.scheduler.capacity.CapacityScheduler</value>
  </property>

配置capacity-scheduler.xml文件

複製代碼
<configuration>
  <property>
    <name>yarn.scheduler.capacity.root.queues</name>
    <value>default,area0,area1,area2</value>
    <description>
      The queues at the this level (root is the root queue).
    </description>
  </property>

  <property>
    <name>yarn.scheduler.capacity.root.default.capacity</name>
    <value>25</value>
  </property>

  <property>
    <name>yarn.scheduler.capacity.root.area0.capacity</name>
    <value>25</value>
  </property>

  <property>
    <name>yarn.scheduler.capacity.root.area1.capacity</name>
    <value>25</value>
  </property>

  <property>
    <name>yarn.scheduler.capacity.root.area2.capacity</name>
    <value>25</value>
  </property>

  <property>
    <name>yarn.scheduler.capacity.root.default.maximum-capacity</name>
    <value>100</value>
  </property>

  <property>
    <name>yarn.scheduler.capacity.root.area0.maximum-capacity</name>
    <value>100</value>
  </property>

  <property>
    <name>yarn.scheduler.capacity.root.area1.maximum-capacity</name>
    <value>100</value>
  </property>

  <property>
    <name>yarn.scheduler.capacity.root.area2.maximum-capacity</name>
    <value>100</value>
  </property>

  <property>
    <name>yarn.scheduler.capacity.root.accessible-node-labels</name>
    <value>*</value>
  </property>

  <property>
    <name>yarn.scheduler.capacity.root.area0.accessible-node-labels</name>
    <value>area0</value>
  </property>

  <property>
    <name>yarn.scheduler.capacity.root.area1.accessible-node-labels</name>
    <value>area1</value>
  </property>

  <property>
    <name>yarn.scheduler.capacity.root.area2.accessible-node-labels</name>
    <value>area2</value>
  </property>

  <property>
    <name>yarn.scheduler.capacity.root.accessible-node-labels.area0.capacity</name>
    <value>33</value>
  </property>

  <property>
    <name>yarn.scheduler.capacity.root.accessible-node-labels.area1.capacity</name>
    <value>33</value>
  </property>

  <property>
    <name>yarn.scheduler.capacity.root.accessible-node-labels.area2.capacity</name>
    <value>34</value>
  </property>

  <property>
    <name>yarn.scheduler.capacity.root.area0.accessible-node-labels.area0.capacity</name>
    <value>100</value>
  </property>

  <property>
    <name>yarn.scheduler.capacity.root.area1.accessible-node-labels.area1.capacity</name>
    <value>100</value>
  </property>

  <property>
    <name>yarn.scheduler.capacity.root.area2.accessible-node-labels.area2.capacity</name>
    <value>100</value>
  </property>

  <property>
    <name>yarn.scheduler.capacity.root.default-node-label-expression</name>
    <value> ,area0,area1,area2</value>
  </property>
 <!--value爲空,則root.default隊列只能在沒有label的node上執行,而我環境環境中不存在沒有label的node,因此提交到root.default的任務卡死-->
  <property>
    <name>yarn.scheduler.capacity.root.default.default-node-label-expression</name>
    <value> </value>
  </property>

  <property>
    <name>yarn.scheduler.capacity.root.area0.default-node-label-expression</name>
    <value>area0</value>
  </property>

  <property>
    <name>yarn.scheduler.capacity.root.area1.default-node-label-expression</name>
    <value>area1</value>
  </property>

  <property>
    <name>yarn.scheduler.capacity.root.area2.default-node-label-expression</name>
    <value>area2</value>
  </property>
</configuration>
複製代碼

 

 

添加Yarn Node Labels

複製代碼
#添加標籤
yarn rmadmin -addToClusterNodeLabels area0,area1,area2
#節點添加標籤
yarn rmadmin -replaceLabelsOnNode Host1:45454,area0
yarn rmadmin -replaceLabelsOnNode Host2:45454,area1
yarn rmadmin -replaceLabelsOnNode Host3:45454,area2
#查看標籤
yarn node -status Host1:45454
#也能夠經過Yarn管理頁面查看Node Label
複製代碼

配置Yarn Node Labels存儲目錄,這樣不用每次重啓服務後從新配置Yarn Node Labels。

在yarn-site.xml中添加下列信息

複製代碼
<property>
       <name>yarn.node-labels.enabled</name>
       <value>true</value>
  </property>
  <property>
     <name>yarn.nodemanager.address</name>
     <value>0.0.0.0:45454</value>
  </property>

  <property>
     <name>yarn.node-labels.manager-class</name>
     <value>org.apache.hadoop.yarn.server.resourcemanager.nodelabels.RMNodeLabelsManager</value>
  </property>
  <property>
     <name>yarn.node-labels.fs-store.root-dir</name>
     <value>hdfs://Host0:8020/yarn/node-labels</value>
     <description>標籤數據在HDFS上的存儲位置</description>
  </property>
複製代碼

在HDFS上建立相應的目錄,並修改權限,我權限設置成了777

這樣配置好以後,yarn node labels就不用重複配置了

相關文章
相關標籤/搜索