這些資料都是我在工做中學習、解決問題的資料彙總,我不能保證這裏羅列的全部資料對看到的人有用,但大部分都通過個人實際驗證。在不斷學習和實踐過程當中,我會不斷更新和總結這些資料,同時歡迎你們留言交流。感謝這些資料的做者。html
一、集羣安裝:java
二、NameNode:linux
HDFS NameNode內存全景android
三、DataNode:git
Hadoop--HDFS之DataNodegithub
四、權限管理:apache
HDFS權限管理實踐api
五、數據平衡:性能優化
How does the HDFS balancer work internally?
HDFS Commands, HDFS Permissions and HDFS Storage
HORTONWORKS官方文檔:Balancing in HDFS
六、集羣治理:
NameNode Analytics: PayPal’s Big Data Guardian
七、問題彙總:
(1)Hadoop Non DFS Used大小問題:
Hadoop hdfs界面:Hadoop Non DFS Used大小問題
關於hadoop hdfs中Non DFS Used佔用很大的問題分析處理
(2)小文件處理:
(3)Namenode寫Journalnode超時,致使Namenode掛掉的問題:
Namenode寫Journalnode超時,致使Namenode掛掉的問題
java.io.IOException: Timed out waiting 20000ms for a quorum of nodes to respond
關於機房交換機故障致使HDFS NameNode掛掉的問題(續)
Timed out waiting 20000ms for a quorum of nodes to respond
Standby NameNode is faling and only one is running
八、其餘:
(1)Hadoop學習之路(十二)分佈式集羣中HDFS系統的各類角色
(2)監控相關:
一、調度隊列:
Hadoop多用戶資源管理–Fair Scheduler介紹與配置
Yarn公平調度器Fair Scheduler根據用戶組分配資源池
【Free Style】Hadoop-Yarn之Resource Manager源碼分析(四)
二、NodeManager:
三、ResourceManger:
四、監控:
五、問題彙總:
(1)資源不足、任務資源分配不合理、隊列資源分配不合理引發的資源預留問題:
What is Memory reserved on Yarn
Aggregate Resource Allocation for a job in YARN
(2)任務kill:
YARN批處理方式kill Applications解決方案
(3)Flink實時計算集羣:ZooKeeper閃斷致使的YARN任務狀態不一致引發的RM崩潰問題:
NullPointerException in RM HA enabled 3-node cluster
NPE happened when RM restart after CapacityScheduler queue configuration changed
Flink on YARN with HA enabled crashes all RMs on attempt restoration
六、其餘:
Yarn: Application Id - How is it generated ?
關於DataNode更改IP地址後所可能引起HDFS集羣狀態變化的分析
二、過往記憶
四、石杉的架構筆記:
大規模集羣下Hadoop NameNode如何承載每秒上千次的高併發訪問
【性能優化的祕密】Hadoop如何將TB級大文件的上傳性能優化上百倍
五、每日 7 千次的跨部門任務調度,有贊怎麼設計大數據開發平臺?
六、Yarn FairScheduler 的資源預留機制致使的一次宕機事故分析
深度剖析Hadoop HDFS,林意羣 著
Hadoop技術內幕:深刻解析YARN架構設計與實現原理,董西成 著
大數據日知錄,張俊林著
一、Hadoop源碼編譯:
(1)環境準備:
brew install autoconf automake libtool
(2)編譯:
Hadoop工程根目錄下的BUILDING.txt中Maven build goals部分列出了編譯Hadoop源碼要用的maven命令,如下是參考文章:
編譯命令:
mvn clean package -Pdist,native -DskipTests -Dtar
(3)問題解決: