(轉)RC ORC Parquet 格式比較和性能測試

(轉)RC ORC Parquet 格式比較和性能測試 原博:http://blog.csdn.net/colorant/ 爲什麼要比較這三者 爲什麼要比較,起因是爲了提高Hadoop集羣的存儲和計算效率,尤其是離線Hive作業的效率,爲什麼比較的是這三者,是因爲三者是目前Hive離線作業中正在大規模使用或可能大規模使用的三種主流的相對成熟的文件格式 對於ORC性能的評測,Hortonworks發
相關文章
相關標籤/搜索