Spark經常使用的4種讀取和存儲數據的格式 & 4種存儲文件系統

Spark的數據讀取與存儲,常規來看可有分爲兩個維度,文件格式和文件系統:linux 文件格式:Text文件、Json文件、Sequence文件和Object文件數據庫 文件系統:linux本地文件系統、HDFS、HBase、MySQL數據庫apache 目錄json 1、文件格式類oop 1. Text文件spa (1)讀取Text文件 sc.textFile("path")scala (2)建
相關文章
相關標籤/搜索