hive中表狀態數據的獲取

在做容量規劃的時候,我們需要關注hive中表的佔用空間大小,文件數量,平均文件大小,已及存儲格式,雖然在hive中也有statistcs的功能,但是值並準確(相比mysql的show table status相差很多) 我們可以通過一些簡單地方法去拿到這個值,比如通過hadoop fs -du 來獲取表佔用的空間大小,通過hadoop fs -count獲取表的文件數量,然後定期取值並load到數
相關文章
相關標籤/搜索