spark常用小函數

1、keyBy 爲rdd按指定key生成key-value形式 scala> val a = sc.parallelize(List("dog", "salmon", "salmon", "rat", "elephant"), 3) a: org.apache.spark.rdd.RDD[String] = ParallelCollectionRDD[123] at parallelize at
相關文章
相關標籤/搜索