二、Hadoop權威指南學習(HDFS)

Hadoop distributed filesystem:以流式數據訪問模式來存儲超大文件。一次寫入、多次讀取。 流式數據訪問  每次讀取都將涉及到數據集的大部分數據甚至全部。(爲了讀取很大的文件) 商用硬件 低時間延遲  不適合在HDFS上運行,HDFS是爲搞數據吞吐量應用優化的,這可能會以提高實踐延遲爲代價。HBase更適合低延遲訪問需求。 大量小文件 無法高效的存儲大量小文件 多用戶寫入,
相關文章
相關標籤/搜索