安利初學者:大數據基礎學習教程之Hive的分區

在Hive Select查詢中一般會掃描整個表的內容,會消耗很多時間做沒必要的工作。有時候只需要掃描表中我們關心的一部分數據,因此建表時引入了partition概念。分區是一種根據「分區列」(partition column)的值對錶進行粗略劃分的機制。Hive中的每個分區對應數據庫中相應分區列的一個索引,每個分區對應着表下的一個目錄,在HDFS上的表現形式與表在HDFS上的表現形式相同,都是以子
相關文章
相關標籤/搜索