Hive四種文件格式詳解

Hive 支持的存儲數的格式主要有: TEXTFILE SEQUENCEFILE ORC PARQUET 列式存儲和行式存儲: 上圖左邊爲邏輯表,右邊第一個爲行式存儲,第二個爲列式存儲。 行存儲的特點: 查詢滿足條件的一整行數據的時候,列存儲則需要去每個聚集的字段找到對應的每個列的值,行存儲只需要找到其中一個值,其餘的值都在相鄰地方,所以此時行存儲查詢的速度更快。 列存儲的特點: 因爲每個字段的數
相關文章
相關標籤/搜索