Learning Spark 學習筆記 第五章 加載或保存數據

大體分爲三種數據源:數據庫 1.文件和文件系統編程 本地或者分佈式文件系統的文件,能夠爲text,json,sequenceFile和協議緩存格式的文件數據。json 2.結構化數據(Spark SQL)緩存 第九章會詳細講述app 3.數據庫和鍵值存儲編程語言 文件格式:分佈式 支持的常見文件格式爲:spa 文本文件:scala 文本文件在spark中加載和保存很簡單,加載一個文本文件爲一個RD
相關文章
相關標籤/搜索