必須掌握的分佈式文件存儲系統—HDFS 大數據

HDFS(Hadoop Distributed File System)分佈式文件存儲系統,主要爲各類分佈式計算框架如Spark、MapReduce等提供海量數據存儲服務,同時HBase、Hive底層存儲也依賴於HDFS。HDFS提供一個統一的抽象目錄樹,客戶端可通過路徑來訪問文件,如hdfs://namenode:port/dir-a/a.data。HDFS集羣分爲兩大角色:Namenode、D
相關文章
相關標籤/搜索