hadoop容災能力測試分類： A1_HADOOP 2015-03-02 09:38 291人閱讀評論(0) 收藏

時間 2019-11-29

標籤 hadoop 能力測試分類 a1 閱讀評論收藏欄目 Hadoop 简体版

原文原文鏈接

實驗簡單來說就是

1. put 一個600M文件，分散3個replica x 9個block 共18個blocks到4個datanode

2. 我關掉了兩個datanode，使得大部分的block只在一個datanode上存在，但由於9個很分散，因此文件能正確取回（靠的是checksum來計算文件值）

3. hadoop namenode很迅速的複製了僅有一個replica的block使之成爲 3 replica(2) but only found 2

4. 我再關掉一個datanode，結果發現每一個datanode被很均衡的分配了block，這樣即便只有一個datanode，也由於以前有確保2個replicas的比率，因此依然healthy

5. 我從這個僅存的datanode中刪除一個blk，namenode report這個文件corrupt，（我其實一直很但願能進safemode，結果-safemode get一直是OFF）

6. 而後我啓動另一個datanode，30秒不到，這個missing的block被從這個新啓動的datanode中迅速「擴展」爲2個replicas

容災性很是可靠，若是使用至少三個rack的話，數據會很是堅挺，對HADOOP信任值 level up!
node

首先來了解一下HDFS的一些基本特性

HDFS設計基礎與目標

硬件錯誤是常態。所以須要冗餘
流式數據訪問。即數據批量讀取而非隨機讀寫，Hadoop擅長作的是數據分析而不是事務處理
大規模數據集
簡單一致性模型。爲了下降系統複雜度，對文件採用一次性寫屢次讀的邏輯設計，便是文件一經寫入，關閉，就不再能修改
程序採用「數據就近」原則分配節點執行
HDFS體系結構

NameNode
DataNode
事務日誌
映像文件
SecondaryNameNode
Namenode

管理文件系統的命名空間
記錄每一個文件數據塊在各個Datanode上的位置和副本信息
協調客戶端對文件的訪問
記錄命名空間內的改動或空間自己屬性的改動
Namenode使用事務日誌記錄HDFS元數據的變化。使用映像文件存儲文件系統的命名空間，包括文件映射，文件屬性等
Datanode

負責所在物理節點的存儲管理
一次寫入，屢次讀取（不修改）
文件由數據塊組成，典型的塊大小是64MB
數據塊儘可能散佈道各個節點
讀取數據流程

客戶端要訪問HDFS中的一個文件
首先從namenode得到組成這個文件的數據塊位置列表
根據列表知道存儲數據塊的datanode
訪問datanode獲取數據
Namenode並不參與數據實際傳輸
HDFS的可靠性

冗餘副本策略
機架策略
心跳機制
安全模式
使用文件塊的校驗和 Checksum來檢查文件的完整性
回收站
元數據保護
快照機制
我分別試驗了冗餘副本策略/心跳機制/安全模式/回收站。下面實驗是關於冗餘副本策略的。

環境：

Namenode/Master/jobtracker: h1/192.168.221.130
SecondaryNameNode: h1s/192.168.221.131
四個Datanode: h2~h4 (IP段:142~144)
爲以防文件過小隻有一個文件塊(block/blk)，咱們準備一個稍微大一點的（600M）的文件，使之能分散分佈到幾個datanode，再停掉其中一個看有沒有問題。
先來put一個文件（爲了方便起見，建議將hadoop/bin追加到$Path變量後
:hadoop fs –put ~/Documents/IMMAUSWX201304
結束後，咱們想查看一下文件塊的狀況，能夠去網頁上看，也能夠在namenode上使用fsck命令來檢查一下，關於fsck命令
:bin/hadoop fsck /user/hadoop_admin/in/bigfile -files -blocks -locations < ~/hadoopfiles/log1.txt
下面打印結果說明個600M文件被劃分爲9個64M的blocks，而且被分散到我當前全部datanode上（共4個），看起來比較平均，

/user/hadoop_admin/in/bigfile/USWX201304 597639882 bytes, 9 block(s): OK
0. blk_-4541681964616523124_1011 len=67108864 repl=3 [192.168.221.131:50010, 192.168.221.142:50010, 192.168.221.144:50010]
1. blk_4347039731705448097_1011 len=67108864 repl=3 [192.168.221.143:50010, 192.168.221.131:50010, 192.168.221.144:50010]
2. blk_-4962604929782655181_1011 len=67108864 repl=3 [192.168.221.142:50010, 192.168.221.143:50010, 192.168.221.144:50010]
3. blk_2055128947154747381_1011 len=67108864 repl=3 [192.168.221.143:50010, 192.168.221.142:50010, 192.168.221.144:50010]
4. blk_-2280734543774885595_1011 len=67108864 repl=3 [192.168.221.131:50010, 192.168.221.142:50010, 192.168.221.144:50010]
5. blk_6802612391555920071_1011 len=67108864 repl=3 [192.168.221.143:50010, 192.168.221.142:50010, 192.168.221.144:50010]
6. blk_1890624110923458654_1011 len=67108864 repl=3 [192.168.221.143:50010, 192.168.221.142:50010, 192.168.221.144:50010]
7. blk_226084029380457017_1011 len=67108864 repl=3 [192.168.221.143:50010, 192.168.221.131:50010, 192.168.221.144:50010]
8. blk_-1230960090596945446_1011 len=60768970 repl=3 [192.168.221.142:50010, 192.168.221.143:50010, 192.168.221.144:50010]

Status: HEALTHY
Total size:    597639882 B
Total dirs:    0
Total files:   1
Total blocks (validated):      9 (avg. block size 66404431 B)
Minimally replicated blocks:   9 (100.0 %)
Over-replicated blocks:        0 (0.0 %)
Under-replicated blocks:       0 (0.0 %)
Mis-replicated blocks:         0 (0.0 %)
Default replication factor:    3
Average block replication:     3.0
Corrupt blocks:                0
Missing replicas:              0 (0.0 %)
Number of data-nodes:          4
Number of racks:               1

h1s,h2,h3,h4四個DD所有參與，跑去h2 (142),h3(143) stop datanode, 從h4上面get，發現竟然可以get回，並且初步來看,size正確，看一下上圖中黃底和綠底都DEAD了，每一個blk都有源能夠取回，因此GET後數據仍然是完整的，從這點看hadoop確實是強大啊，load balancing也作得很不錯，數據看上去很堅強，容錯性作得不錯

1

再檢查一下，我原本想測試safemode的，結果隔一會一刷，原本有幾個blk只有1個livenode的，如今又被所有複製爲確保每一個有2個了！

hadoop_admin@h1:~/hadoop-0.20.2$ hadoop fsck /user/hadoop_admin/in/bigfile -files -blocks -locations
/user/hadoop_admin/in/bigfile/USWX201304 597639882 bytes, 9 block(s):
Under replicated blk_-4541681964616523124_1011. Target Replicas is 3 but found 2 replica(s).
Under replicated blk_4347039731705448097_1011. Target Replicas is 3 but found 2 replica(s).
Under replicated blk_-4962604929782655181_1011. Target Replicas is 3 but found 2 replica(s).
Under replicated blk_2055128947154747381_1011. Target Replicas is 3 but found 2 replica(s).
Under replicated blk_-2280734543774885595_1011. Target Replicas is 3 but found 2 replica(s).
Under replicated blk_6802612391555920071_1011. Target Replicas is 3 but found 2 replica(s).
Under replicated blk_1890624110923458654_1011. Target Replicas is 3 but found 2 replica(s).
Under replicated blk_226084029380457017_1011. Target Replicas is 3 but found 2 replica(s).
Under replicated blk_-1230960090596945446_1011. Target Replicas is 3 but found 2 replica(s).
0. blk_-4541681964616523124_1011 len=67108864 repl=2 [192.168.221.131:50010, 192.168.221.144:50010]
1. blk_4347039731705448097_1011 len=67108864 repl=2 [192.168.221.144:50010, 192.168.221.131:50010]
2. blk_-4962604929782655181_1011 len=67108864 repl=2 [192.168.221.144:50010, 192.168.221.131:50010]
3. blk_2055128947154747381_1011 len=67108864 repl=2 [192.168.221.144:50010, 192.168.221.131:50010]
4. blk_-2280734543774885595_1011 len=67108864 repl=2 [192.168.221.131:50010, 192.168.221.144:50010]
5. blk_6802612391555920071_1011 len=67108864 repl=2 [192.168.221.144:50010, 192.168.221.131:50010]
6. blk_1890624110923458654_1011 len=67108864 repl=2 [192.168.221.144:50010, 192.168.221.131:50010]
7. blk_226084029380457017_1011 len=67108864 repl=2 [192.168.221.144:50010, 192.168.221.131:50010]
8. blk_-1230960090596945446_1011 len=60768970 repl=2 [192.168.221.144:50010, 192.168.221.131:50010]

我決定再關一個datanode，結果等了好半天也沒見namenode發現它死了，這是由於心跳機制，datanode每隔3秒會向namenode發送heartbeat指令代表它的存活，但若是namenode很長時間（5~10分鐘看設置）沒有收到heartbeat即認爲這個NODE死掉了，就會作出BLOCK的複製操做，以保證有足夠的replica來保證數據有足夠的容災/錯性，如今再打印看看，發現由於只有一個live datanode，因此如今每一個blk都有且只有一份

hadoop_admin@h1:~$ hadoop fsck /user/hadoop_admin/in/bigfile -files -blocks -locations
/user/hadoop_admin/in/bigfile/USWX201304 597639882 bytes, 9 block(s): Under replicated blk_-4541681964616523124_1011. Target Replicas is 3 but found 1 replica(s).
Under replicated blk_4347039731705448097_1011. Target Replicas is 3 but found 1 replica(s).
Under replicated blk_-4962604929782655181_1011. Target Replicas is 3 but found 1 replica(s).
Under replicated blk_2055128947154747381_1011. Target Replicas is 3 but found 1 replica(s).
Under replicated blk_-2280734543774885595_1011. Target Replicas is 3 but found 1 replica(s).
Under replicated blk_6802612391555920071_1011. Target Replicas is 3 but found 1 replica(s).
Under replicated blk_1890624110923458654_1011. Target Replicas is 3 but found 1 replica(s).
Under replicated blk_226084029380457017_1011. Target Replicas is 3 but found 1 replica(s).
Under replicated blk_-1230960090596945446_1011. Target Replicas is 3 but found 1 replica(s).

我如今把其中一個BLK從這個僅存的Datanode中移走使之corrupt，我想實驗，重啓一個DATANODE後，會不會復員
hadoop_admin@h4:/hadoop_run/data/current$ mv blk_4347039731705448097_1011* ~/Documents/
而後爲了避免必要等8分鐘DN發block report，我手動修改了h4的dfs.blockreport.intervalMsec值爲30000，stop datanode,再start (另外，你應該把hadoop/bin也加入到Path變量後面，這樣你能夠不帶全路徑執行hadoop命令，結果，檢測它已被損壞
hadoop_admin@h1:~$ hadoop fsck /user/hadoop_admin/in/bigfile -files -blocks -locations

/user/hadoop_admin/in/bigfile/USWX201304 597639882 bytes, 9 block(s): Under replicated blk_-4541681964616523124_1011. Target Replicas is 3 but found 1 replica(s).

/user/hadoop_admin/in/bigfile/USWX201304: CORRUPT block blk_4347039731705448097
Under replicated blk_-4962604929782655181_1011. Target Replicas is 3 but found 1 replica(s).
Under replicated blk_2055128947154747381_1011. Target Replicas is 3 but found 1 replica(s).
Under replicated blk_-2280734543774885595_1011. Target Replicas is 3 but found 1 replica(s).
Under replicated blk_6802612391555920071_1011. Target Replicas is 3 but found 1 replica(s).
Under replicated blk_1890624110923458654_1011. Target Replicas is 3 but found 1 replica(s).
Under replicated blk_226084029380457017_1011. Target Replicas is 3 but found 1 replica(s).
Under replicated blk_-1230960090596945446_1011. Target Replicas is 3 but found 1 replica(s).
MISSING 1 blocks of total size 67108864 B
0. blk_-4541681964616523124_1011 len=67108864 repl=1 [192.168.221.144:50010]
1. blk_4347039731705448097_1011 len=67108864 MISSING!
2. blk_-4962604929782655181_1011 len=67108864 repl=1 [192.168.221.144:50010]
3. blk_2055128947154747381_1011 len=67108864 repl=1 [192.168.221.144:50010]
4. blk_-2280734543774885595_1011 len=67108864 repl=1 [192.168.221.144:50010]
5. blk_6802612391555920071_1011 len=67108864 repl=1 [192.168.221.144:50010]
6. blk_1890624110923458654_1011 len=67108864 repl=1 [192.168.221.144:50010]
7. blk_226084029380457017_1011 len=67108864 repl=1 [192.168.221.144:50010]
8. blk_-1230960090596945446_1011 len=60768970 repl=1 [192.168.221.144:50010]

Status: CORRUPT
Total size:    597639882 B
Total dirs:    0
Total files:   1
Total blocks (validated):      9 (avg. block size 66404431 B)
   ********************************
   CORRUPT FILES:        1
   MISSING BLOCKS:       1
   MISSING SIZE:         67108864 B
   CORRUPT BLOCKS:       1
   ********************************
Minimally replicated blocks:   8 (88.888885 %)
Over-replicated blocks:        0 (0.0 %)
Under-replicated blocks:       8 (88.888885 %)
Mis-replicated blocks:         0 (0.0 %)
Default replication factor:    3
Average block replication:     0.8888889
Corrupt blocks:                1
Missing replicas:              16 (200.0 %)
Number of data-nodes:          1
Number of racks:               1

The filesystem under path '/user/hadoop_admin/in/bigfile' is CORRUPT

我如今啓動一個DATANODE h1s（131），結果很快的在30秒以內，它就被hadoop原地滿HP復活了，如今每一個blk都有了兩份replica
hadoop_admin@h1:~$ hadoop fsck /user/hadoop_admin/in/bigfile -files -blocks -locations
/user/hadoop_admin/in/bigfile/USWX201304 597639882 bytes, 9 block(s): Under replicated blk_-4541681964616523124_1011. Target Replicas is 3 but found 2 replica(s).
Under replicated blk_4347039731705448097_1011. Target Replicas is 3 but found 2 replica(s).
Under replicated blk_-4962604929782655181_1011. Target Replicas is 3 but found 2 replica(s).
Under replicated blk_2055128947154747381_1011. Target Replicas is 3 but found 2 replica(s).
Under replicated blk_-2280734543774885595_1011. Target Replicas is 3 but found 2 replica(s).
Under replicated blk_6802612391555920071_1011. Target Replicas is 3 but found 2 replica(s).
Under replicated blk_1890624110923458654_1011. Target Replicas is 3 but found 2 replica(s).
Under replicated blk_226084029380457017_1011. Target Replicas is 3 but found 2 replica(s).
Under replicated blk_-1230960090596945446_1011. Target Replicas is 3 but found 2 replica(s).
0. blk_-4541681964616523124_1011 len=67108864 repl=2 [192.168.221.144:50010, 192.168.221.131:50010]
1. blk_4347039731705448097_1011 len=67108864 repl=2 [192.168.221.131:50010, 192.168.221.144:50010]
2. blk_-4962604929782655181_1011 len=67108864 repl=2 [192.168.221.144:50010, 192.168.221.131:50010]
3. blk_2055128947154747381_1011 len=67108864 repl=2 [192.168.221.144:50010, 192.168.221.131:50010]
4. blk_-2280734543774885595_1011 len=67108864 repl=2 [192.168.221.144:50010, 192.168.221.131:50010]
5. blk_6802612391555920071_1011 len=67108864 repl=2 [192.168.221.144:50010, 192.168.221.131:50010]
6. blk_1890624110923458654_1011 len=67108864 repl=2 [192.168.221.144:50010, 192.168.221.131:50010]
7. blk_226084029380457017_1011 len=67108864 repl=2 [192.168.221.144:50010, 192.168.221.131:50010]
8. blk_-1230960090596945446_1011 len=60768970 repl=2 [192.168.221.144:50010, 192.168.221.131:50010]

發現這個文件被從131成功複製回了144 (h4)。

結論：HADOOP容災太堅挺了，我如今堅信不疑了！

另外有一個沒有粘出來的提示就是，h4 datanode上有很多從新format遺留下來的badLinkBlock，在從新put同一個文件的時候，hadoop將那些老舊殘留的block文件所有都刪除了。這說明它是具備刪除無效bad block的功能的。

安全

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。

hadoop容災能力測試 分類： A1_HADOOP 2015-03-02 09:38 291人閱讀 評論(0) 收藏

hadoop容災能力測試分類： A1_HADOOP 2015-03-02 09:38 291人閱讀評論(0) 收藏