hive的索引機制

1)建立索引 在指定列上建立索引,會產生一張索引表(Hive的一張物理表),裏面的字段包括,索引列的值、該值對應的HDFS文件路徑、該值在文件中的偏移量; hive的索引是需要手動進行維護的       2)利用索引查詢數據 ① 在執行索引字段查詢時候,首先額外生成一個MR job,根據對索引列的過濾條件,從索引表中過濾出索引列的值對應的hdfs文件路徑及偏移量,輸出到hdfs上的一個文件中。 ②
相關文章
相關標籤/搜索