經常使用SparkRDD容易混淆的算子區別(Scala版本)

經常使用SparkRDD容易混淆的算子區別 1.map與flatMap的區別 # 初始化數據 val rdd1 = sc.parallelize(Array("hello world","i love you")) map # map算子 rdd1.map(_.split(" ")).collect # map算子結果輸出 res0: Array[Array[String]] = Array(A
相關文章
相關標籤/搜索