hadoop_namenode若是選擇在哪一個datanode存儲副本

須要從可靠性,寫入帶寬,讀取帶寬進行權衡。node

第一個block副本放在運行client所在的節點上(若是client不在集羣範圍內,則第一個node是隨機選取的)性能

第二個block副本放置在與第一個節點不一樣的機架中的node中(隨機選擇)集羣

第三個block副本放置與第二個副本所在節點同一個機架的另外一個節點上。cli

若是還有更多的副本就隨機放在集羣的node裏,不過系統會盡可能避免在同一個機架上放太多副本。遍歷

良好的穩定性:數據塊存儲在兩個機架中數據

寫入帶寬:寫入操做只須要遍歷一個交換機客戶端

讀取性能:能夠從兩個機架中選擇讀取block

集羣中塊的均勻分佈:客戶端只在本地機架上寫入一個塊。系統

相關文章
相關標籤/搜索