PySpark學習筆記-數據讀取與保存

1.常見的讀取數據源python 文件格式和文件系統。對於存儲在本地文件系統或分佈式文件系統(好比HDFS)中的數據,Spark能夠訪問不少種不一樣的文件格式。包括文本文件、JSON、SequenceFile、以及protocol buffer。 Spark SQL中的結構化數據源。 數據庫和鍵值存儲。Spark自帶的庫以及一些第三方庫,能夠用來鏈接HBase、JDBC源。 格式名稱 結構化 備註
相關文章
相關標籤/搜索