深入理解 Hive 分區分桶

大數據核心原理與實踐專欄 爲何分區分桶 我們知道傳統的DBMS系統一般都具有表分區的功能,通過表分區能夠在特定的區域檢索數據,減少掃描成本,在一定程度上提高查詢效率,當然我們還可以通過進一步在分區上建立索引進一步提升查詢效率。在此就不贅述了。 在Hive數倉中也有分區分桶的概念,在邏輯上分區表與未分區表沒有區別,在物理上分區表會將數據按照分區鍵的列值存儲在表目錄的子目錄中,目錄名=「分區鍵=鍵值」
相關文章
相關標籤/搜索