Hadoop2.x HDFS源碼剖析---概述

一、HDFS概述 基於hadoop2.6 HDFS被設計能夠運行在通用硬件上、提供流式數據操作、能夠處理超大文件的分佈式文件系統。 特點:高容錯和高吞吐量、易擴展、高可靠性 HDFS的四個核心模塊:namenode節點、datanode節點、客戶端、HDFS協議(RPC協議、流式接口協議:HTTP和TCP) 基本概念 1、數據塊(block) 數據塊是HDFS文件處理(讀和寫)的最小單元,默認是1
相關文章
相關標籤/搜索