Hadoop分佈式文件系統HDFS

當某個數據集超出單個物理機的存儲能力時,我們可以考慮使用集羣。管理跨網絡機器存儲的文件系統叫做分佈式文件系統(Distributed FileSystem)。隨着多節點的引入,相應的問題也就出現了,例如其中最重要的一個問題就是如何保證在某個節點失敗的情況下數據不會丟失。Hadoop中有一個核心子項目HDFS(Hadoop Distributed FileSystem)就是用來管理集羣的存儲問題的,
相關文章
相關標籤/搜索