Hive架構及Hive On Spark

Hive的所有數據都存在HDFS中. (1)Table:每個表都對應在HDFS中的目錄下,數據是經過序列化後存儲在該目錄中。同時Hive也支持表中的數據存儲在其他類型的文件系統中,如NFS或本地文件系統。 (2)Partition(分區):Hive中的分區類似於RDBMS中的索引,每個Partition都有一個對應的目錄,查詢的時候可以減少數據的規模。 (3)Bucket(桶):即使將數據分區後,
相關文章
相關標籤/搜索