Hadoop的文件系統node
1 Block(塊)
HDFS將文件分配成block來存儲,每一個塊默認64MB,塊是文件存儲處理的邏輯單元,按照block管理
2 NameNode
管理節點,存放元數據網絡
爲了保證硬件上的容錯,每一個數據塊3個副本,分佈在兩個機架內的三個節點(兩份在同一個機架 )。一個機架故障不影響。
併發
NameNode和DataNode之間有心跳協議,
DataNode按期向NameNode發送心跳信息(網絡 關機)
Secondary NameNode
NameNode的備份,按期同步元數據映像文件和修改日誌
故障時轉正
oop
讀取
- 客戶端先在NameNode查找DataNode的位置
- 再按照位置在datanode中找到,下載下來
寫入ui
更新NameNode
spa
1 數據冗餘 硬件容錯
* 2 流式的數據訪問*
3 存儲大文件 不適合存儲大量小文件
4 適合數據批量讀寫 吞吐量高
不適合交互式應用 高延遲
5適合一次寫入屢次讀取,順序讀寫
不支持多用戶併發寫相同文件設計
可視化操做日誌
hadoop namenode -format
查看文件夾code
hadoop fs -ls/
提交orm
hadoop fs -put hadoop-env.sh 目錄
從HDFS下載
hadoop fs -get input/hadoop-env.sh hadoop-env2.sh
hadoop fs -get (HDFS目錄) (另命名)
看文件系統全部信息
hadoop dfsadmin -report