Hadoop入門（5）--HDFS

時間 2019-11-12

標籤 hadoop 入門 hdfs 欄目 Hadoop 简体版

原文原文鏈接

HDFS簡介

Hadoop的文件系統node

1 Block(塊)
HDFS將文件分配成block來存儲，每一個塊默認64MB，塊是文件存儲處理的邏輯單元，按照block管理
2 NameNode
管理節點，存放元數據網絡

爲了保證硬件上的容錯，每一個數據塊3個副本，分佈在兩個機架內的三個節點（兩份在同一個機架）。一個機架故障不影響。
併發

NameNode和DataNode之間有心跳協議，
DataNode按期向NameNode發送心跳信息（網絡關機）
Secondary NameNode
NameNode的備份，按期同步元數據映像文件和修改日誌
故障時轉正
oop

讀取
- 客戶端先在NameNode查找DataNode的位置
- 再按照位置在datanode中找到，下載下來

寫入ui

可視化操做日誌

hadoop namenode -format

查看文件夾code

hadoop fs -ls/

提交orm

hadoop fs -put hadoop-env.sh 目錄

從HDFS下載

hadoop fs -get input/hadoop-env.sh hadoop-env2.sh

hadoop fs -get (HDFS目錄) (另命名)

看文件系統全部信息

hadoop dfsadmin -report

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。