spark core之讀寫數據(八)

  spark支持多種數據源,從整體來分分爲兩大部分:文件系統和數據庫。javascript 文件系統   文件系統主要有本地文件系統、Amazon S三、HDFS等。php   文件系統中存儲的文件有多種存儲格式。spark支持的一些常見格式有:java 格式名稱 結構化 說明 文件文件 否 普通文件文件,每行一條記錄 JSON 半結構化 常見的基於文本的半結構化數據 CSV 是 常見的基於文本
相關文章
相關標籤/搜索