Spark編程模型經典解析(二)

創建RDD 方式一:從集合創建RDD ● makeRDD ● Parallelize ● 注意:makeRDD可以指定每個分區perferredLocations參數,parallelize則沒有。 方式二:讀取外部存儲創建RDD Spark與Hadoop完全兼容,所以對Hadoop所支持的文件類型或者數據庫類型,Spark同樣   支持。 ● 多文件格式支持: ● 多文件系統支持: 1) 本地文
相關文章
相關標籤/搜索