分佈式文件系統比較出名的有HDFS 和 GFS,其中HDFS比較簡單一點。本文是一篇描述很是簡潔易懂的漫畫形式講解HDFS的原理。比通常PPT要通俗易懂不少。不可貴的學習資料。html
一、三個部分: 客戶端、nameserver(可理解爲主控和文件索引,相似Linux的inode)、datanode(存放實際數據)node
在這裏,client的形式我所瞭解的有兩種,經過Hadoop提供的api所編寫的程序能夠和hdfs進行交互,另一種就是安裝了hadoop的datanode其也能夠經過命令行與hdfs系統進行交互,如在datanode上上傳則使用以下命令行:bin/hadoop fs -put example1 user/chunk/linux
二、如何寫數據過程api
三、讀取數據過程微信
四、容錯:第一部分:故障類型及其檢測方法(nodeserver 故障,和網絡故障,和髒數據問題)網絡
五、容錯第二部分:讀寫容錯分佈式
六、容錯第三部分:dataNode 失效oop
七、備份規則佈局
八、結束語post