spark從入門到放棄三十一:Spark Sql (4)數據源Parquet

文章地址:http://www.haha174.top/article/details/253452 項目源碼:https://github.com/haha174/spark.git 1.簡介 parquet 是面向分析型業務的列示存儲格式. 列式存儲比行式存儲有哪些優點呢 1.能夠跳過不符合條件的數據,只讀取須要的數據,下降IO的數量。 2.壓縮編碼格式能夠下降磁盤空間。因爲同一列的數據類型是
相關文章
相關標籤/搜索