Spark 經常使用api介紹

topweb val rdd = sc.parallelize(Array(23,67,12,90,8,67)) rdd.first rdd.take(5) //top全局排序,耗內存 rdd.top(1) res24: Array[Int] = Array(90) rdd.top(2) res25: Array[Int] = Array(90, 67) sortByKeysvg scala> w
相關文章
相關標籤/搜索