HDFS詳解

1.HDFS的設計 1.1.HDFS使用場景 超大文件----在這裏指具有幾百MB幾百GB甚至幾百TB大小的文件。目前已經存儲PB級數據的hadoop集羣了; 流式數據訪問----一次寫入、多次讀取是高效的訪問模式。數據集通常由數據源生成或從數據源複製而來,接着長時間在此數據集上進行各類分析。每次分析都會涉及該數據集的大部分數據甚至全部,因此讀取整個數據集的時間延遲比讀取第一條記錄的時間延遲更重要
相關文章
相關標籤/搜索