建立RDD

建立RDD的兩種方式:shell 1. 讀取穩定物理存儲(eg:HDFS)外部數據集學習 2. 在驅動程序中對一個集合進行並行化(也就是其它已有的RDD上執行肯定性操做,這些肯定性操做稱做轉換(Transformation))測試  方法一:建立 RDD 最簡單的方式就是把程序中一個已有的集合傳給 SparkContext 的 parallelize()方法,這種方式在學習 Spark 時很是有用
相關文章
相關標籤/搜索