研磨Hadoop之HDFS初探

一、HDFS概述 1、HDFS的概念 HDFS是一個分佈式文件系統,通過目錄樹來定位文件。HDFS的設計適合一次寫入,多次讀取的場景,且不支持文件的修改。 2、HDFS優缺點 (1)優點 1)高容錯性 數據自動保存多個副本,通過增加副本提高容錯性。 某一個副本丟失,可以自動恢復 2)適合大數據處理 數據規模:可以處理GB、TB、甚至PB的數據 文件規模:處理百萬以上的文件數量 3)流式數據訪問 一
相關文章
相關標籤/搜索