hadoop(三):hdfs 機架感知

        client 向 Active NN 發送寫請求時,NN爲這些數據分配DN地址,HDFS文件塊副本的放置對於系統總體的可靠性和性能有關鍵性影響。一個簡單但非優化的副本放置策略是,把副本分別放在不一樣機架,甚至不一樣IDC,這樣能夠防止整個機架、甚至整個IDC崩潰帶來的錯誤,可是這樣文件寫必須在多個機架之間、甚至IDC之間傳輸,增長了副本寫的代價,是否有較優的方案來解決這個問題呢?node

目錄:apache

  • 經常使用策略
  • 機架配置
  • 分配原理

經常使用策略:vim


  • hdfs 在缺省配置下副本數是3個,一般的策略是:
  1. 第一個副本放在和Client相同機架的Node裏(若是Client不在集羣範圍,第一個Node是隨機選取不太滿或者不太忙的Node)
  2. 第二個副本放在與第一個Node不一樣的機架中的Node
  3. 第三個副本放在與第二個Node所在機架裏不一樣的Node. 示例圖以下:

  • 默認狀況下,Hadoop機架感知是沒有啓用的,這時任何一臺 DN 機器,無論物理上是否屬於同一個機架,NN 都會默認將他們默認爲在/default-rack下, 此時,就很容易出現以前提到的增添機架間網絡負載的狀況,如咱們前面單節介紹基於 hdp2.4安裝的集羣就沒指定rack, 以下圖所示。

機架配置:網絡


  • hdfs 的機架感知功能須要在NN機器的hadoop下 core-site.xml裏配置net.topology.script.file.name選項,這個配置選項的value指定爲一個可執行程序,一般爲一個腳本,該腳本接受一個參數,輸出一個值
  • 接受的參數一般爲datanode機器的ip地址,而輸出的值一般爲該ip地址對應的datanode所在的rackID
  • Namenode啓動時,會判斷該配置選項是否爲空,若是非空,則表示已經啓用機架感知的配置,此時namenode會根據配置尋找該腳本,並在接收到每個datanode的heartbeat時,將該datanode的ip地址做爲參數傳給該腳本運行,並將獲得的輸出做爲該datanode所屬的機架,保存到內存的一個map
  • 腳本的編寫,參見Hadoop官方給出的腳本:http://wiki.apache.org/hadoop/topology_rack_awareness_scripts
  • 在 hdp2.4 安裝後的 hadoop 目錄下的配置文件中, 查看 hadoop的 core-site.xml 文件,已經設置了此選項,以下圖
  • 查看 topology_script.py 腳本,裏面使用的文件是 topology_mappings.data,用vim編輯此文件,換成真實的網絡拓撲,以下
    [network_topology]
    hdp2=/rack1
    192.168.2.2=/rack2
    hdp3=/rack2
    192.168.2.99=/rack1
  •  手工修改配置文件,重啓服務後修改內容會被沖掉,因此用咱們在 ambaria 上去修改,選擇 "host" -> "Action" -> "Selected hosts" -> "hosts" --> "set Rack" 修改每臺host對應的rack, 保存修改,重啓因修改配置而受影響的組件服務,成功後示例以下,這時再去看 topology_mappings.data 的內容已經修改爲功:app

  •     

分配原理:oop


  • 有了機架感知,NameNode就能夠畫出下圖所示的datanode網絡拓撲圖,
  • 最底層是Hx是 datanode, 則H1的rackid=/D1/R1/H1,H1的parent是R1,R1的是D1,有了這些rackid信息就能夠計算出任意兩臺datanode之間的距離
    distance(/D1/R1/H1,/D1/R1/H1)=0  相同的datanode
    distance(/D1/R1/H1,/D1/R1/H2)=2  同一rack下的不一樣datanode
    distance(/D1/R1/H1,/D1/R1/H4)=4  同一IDC下的不一樣datanode
    distance(/D1/R1/H1,/D2/R3/H7)=6  不一樣IDC下的datanode
  •  寫文件時根據策略輸入 dn 節點列表,讀文件時按與client由近到遠距離返回 dn 列表性能

相關文章
相關標籤/搜索