Spark編程模型(中)

創建RDD 方式一:從集合創建RDD makeRDD Parallelize 注意:makeRDD可以指定每個分區perferredLocations參數parallelize則沒有。 方式二:讀取外部存儲創建RDD   Spark與Hadoop完全兼容,所以對Hadoop所支持的文件類型或者數據庫類型,Spark同樣支持。 多文件格式支持: 多文件系統支持:    1)本地文件系統    2)S
相關文章
相關標籤/搜索