JavaSpark-數據讀存-文本文件

時間 2019-12-05

標籤 javaspark 數據文本文件简体版

原文原文鏈接

在數據的存取中輸出格式是很重要的，這利於下游處理程序。有時數據量達到本地沒法存放時，就須要考慮別的存取方法 spark支持不少種輸入源，由於spark是基於hadoop生態構建的，支持InputFormat和OutputFormat接口訪問。而這兩個接口也是map/reduce用來鏈接數據源的java API，同時（S3，HDFS，Cassandra，Hbase）等存儲系統也支持這種接口。支持相同

>>阅读原文<<