JavaSpark-數據讀存-文本文件

在數據的存取中輸出格式是很重要的,這利於下游處理程序。有時數據量達到本地沒法存放時,就須要考慮別的存取方法 spark支持不少種輸入源,由於spark是基於hadoop生態構建的,支持InputFormat和OutputFormat接口訪問。而這兩個接口也是map/reduce用來鏈接數據源的java API,同時(S3,HDFS,Cassandra,Hbase)等存儲系統也支持這種接口。支持相同
相關文章
相關標籤/搜索