hive 中的存儲格式

存儲格式 行式存儲 一行的數據都在一個hdfs block上,這樣在select * from table 時 ,能全部查出,但是在查某幾列時他也會將不需要的列也會取出來在選擇需要的列,增加了沒必要的磁盤io 列式存儲 每一列數據都類型都一樣,可以採取一定的壓縮,在查某幾列時,只需要查詢需要的列不會查詢不需要的,但是在select * from table時,由於不同列不在一起,會進行數據重組 h
相關文章
相關標籤/搜索