parquet文件格式解析

參考資料: https://parquet.apache.org/documentation/latest/ https://www.jianshu.com/p/47b39ae336d5 前言 Apache Parquet是Hadoop生態系統中任何項目均可使用的列式存儲格式,由於OLAP場景下的數據大部分情況下都是批量導入,基本上不需要支持單條記錄的增刪改操作,而查詢的時候大多數都是隻使用部分列
相關文章
相關標籤/搜索