第65課:Spark SQL下Parquet深入進階

內容:     Spark SQl下的Parquet的序列化     SparkSQL下的Parquet源碼解析     SparkSQL的Parquet總結 一、Spark SQl下的Parquet的序列化     1.block:parquet層面和row group是一個意思     2.row group:邏輯概念,用於對row進行分區。由數據集中每個column的column chunk
相關文章
相關標籤/搜索