hive文件的存儲格式

列式存儲和行式存儲 上圖左邊爲邏輯表,右邊第一個爲行式存儲,第二個爲列式存儲。 行存儲的特點: 查詢滿足條件的一整行數據的時候,列存儲則需要去每個聚集的字段找到對應的每個列的值,行存儲只需要找到其中一個值,其餘的值都在相鄰地方,所以此時行存儲查詢的速度更快。行存適用於對幾行或者多行的操作(查詢或者更新)。 列存儲的特點:因爲每個字段的數據聚集存儲,在查詢只需要少數幾個字段的時候,能大大減少讀取的數
相關文章
相關標籤/搜索