Spark--數據讀取與保存

時間 2019-12-06

標籤 spark 數據讀取保存欄目 Spark 简体版

原文原文鏈接

一、動機有時候數據量會大到本機可能沒法存儲，這時就須要探索別的讀取和保存方法了。 Spark支持不少種輸入源和輸出源。一部分緣由是Spark自己是基於Hadoop生態圈二構建的，so spark能夠經過Hadoop MapReduce 所使用的InputFormat 和 OutPutFormat 接口訪問數據，而大部分常見的文件格式與存儲系統（S3,HDFS,Cassandra,HBase等）都

>>阅读原文<<