spark讀取json,parquet文件

spark支持的一些常見的格式:sql 文本文件,無任何的格式apache json文件,半結構化json parquet,一種流行的列式存儲格式session sequencefile,一種用於key-value的hadoop文件格式,若是須要讀hdfs數據的話,一般走hive的比較多。oop 在企業中不多用,緣由是寫sql的時候,能用sparksession解決的,都不會去弄rdd的各類tra
相關文章
相關標籤/搜索