Hive:ORC File Format存儲格式詳解

一、定義 ORC File,它的全名是Optimized Row Columnar (ORC) file,其實就是對RCFile做了一些優化。據官方文檔介紹,這種文件格式可以提供一種高效的方法來存儲Hive數據。它的設計目標是來克服Hive其他格式的缺陷。運用ORC File可以提高Hive的讀、寫以及處理數據的性能。 和RCFile格式相比,ORC File格式有以下優點: (1)、每個task
相關文章
相關標籤/搜索