Spark--數據讀取與保存

一、動機 有時候數據量會大到本機可能沒法存儲,這時就須要探索別的讀取和保存方法了。 Spark支持不少種輸入源和輸出源。一部分緣由是Spark自己是基於Hadoop生態圈二構建的,so spark能夠經過Hadoop MapReduce 所使用的InputFormat 和 OutPutFormat 接口訪問數據,而大部分常見的文件格式與存儲系統(S3,HDFS,Cassandra,HBase等)都
相關文章
相關標籤/搜索