Hive文件存儲格式(TEXTFILE 、ORC、PARQUET三者的存儲格式的壓縮對比和查詢速度對比)

綜述: HIve的文件存儲格式有四種:TEXTFILE 、SEQUENCEFILE、ORC、PARQUET,前面兩種是行式存儲,後面兩種是列式存儲;所謂的存儲格式就是在Hive建表的時候指定的將表中的數據按照什麼樣子的存儲方式,若是指定了A方式,那麼在向表中插入數據的時候,將會使用該方式向HDFS中添加相應的數據類型。算法 若是爲textfile的文件格式,直接load就OK,不須要走MapRed
相關文章
相關標籤/搜索