Spark SQL的Parquet那些事兒.docx

Parquet是一種列式存儲格式,不少種處理引擎都支持這種存儲格式,也是sparksql的默認存儲格式。Spark SQL支持靈活的讀和寫Parquet文件,而且對parquet文件的schema能夠自動解析。當Spark SQL須要寫成Parquet文件時,處於兼容的緣由全部的列都被自動轉化爲了nullable。面試1讀寫Parquet文件 // Encoders for most common
相關文章
相關標籤/搜索