Parquet文件結構筆記

  Parquet是面向分析型業務的列式存儲格式,由Twitter和Cloudera合作開發,2015年5月從Apache的孵化器裏畢業成爲Apache頂級項目,那麼這裏就總結下Parquet數據結構到底是什麼樣的呢?   一個Parquet文件是由一個header以及一個或多個block塊組成,以一個footer結尾。header中只包含一個4個字節的數字PAR1用來識別整個Parquet文件格
相關文章
相關標籤/搜索