Hadoop 分佈式文件系統 - HDFS

   當數據集超過一個單獨的物理計算機的存儲能力時,便有必要將它分不到多個獨立的計算機上。管理着跨計算機網絡存儲的文件系統稱爲分佈式文件系統。Hadoop 的分佈式文件系統稱爲 HDFS,它 是爲 以流式數據訪問模式存儲超大文件而設計的文件系統。 「超大文件」是指幾百 TB 大小甚至 PB 級的數據; 流式數據訪問:HDFS 建立在這樣一個思想上 - 一次寫入、多次讀取的模式是最高效的。一個數據集
相關文章
相關標籤/搜索