大數據文件格式對比 Parquet Avro ORC 特點 格式 優劣勢

文章目錄 背景 Apache Avro Apache Parquet Apache ORC 總結 Ref 背景 在大數據環境中,有各種各樣的數據格式,每個格式各有優缺點。如何使用它爲一個特定的用例和特定的數據管道。數據可以存儲爲可讀的格式如JSON或CSV文件,但這並不意味着實際存儲數據的最佳方式。 有三個文件格式用於Hadoop集羣: Optimized Row Columnar (ORC) A
相關文章
相關標籤/搜索