HDFS離線分析FsImage元數據

概觀 HDFS是Hadoop的一部分,它具有下載當前名稱節點快照的命令。我們可以通過Spark加載圖像或對其進行數據攝取,以使其進入Hive以分析數據並驗證它如何使用HDFS。 HDFS文件系統元數據存儲在名爲「FsImage」的文件中。我們在此快照中包含: 整個文件系統命名空間。 地圖,塊和文件複製。 配額,ACLS等屬性 我必須解決的問題如下: 運行該命令以下載映像並生成XML文件。 實現Sp
相關文章
相關標籤/搜索