05-數據讀取與保存

前言 Spark中常用的文件格式有:文本文件、JSON、CSV、SequenceFile等。 下面介紹這些文件格式的讀取與保存。 1 文本文件 讀取 測試數據: 使用 textFile,參數爲目錄 a: 使用 wholeTextFile,參數爲目錄 a: 因此,根據實際需要可以選擇使用哪種方式讀取文本文件。 保存 保存使用 saveAsFile,參數爲目錄名稱,文件保存在該目錄下: 2 JSON
相關文章
相關標籤/搜索