Spark-數據讀取與保存(Scala版)

文件格式 Spark對文件的讀取和保存方式都很簡單,會根據文件的擴展名選擇對應的處理方式java Spark支持的一些常見格式 格式名稱 結構化 備註 文本文件 否 普通的文本文件,每行一條記錄 JSON 半結構化 常見的基於文本的格式,半結構化,大多數庫都要求每行一條記錄 CSV 是 很是常見的基於文本的格式,一般在電子表格應用中使用 sequenceFiles 是 一種用於鍵值對數據常見的Ha
相關文章
相關標籤/搜索