Pyspark實戰(三)wordcount算子分析

Pyspark的本質仍是調用scala的jar包,咱們以上篇文章wordcount爲例,其中一段代碼爲:app rdd.flatMap(lambda x:x.split( )).map(lambda x:(x,1)).reduceByKey(lambda x,y:x+y).foreach(lambda x:print(x)) 其中:flatMap,map爲轉換算子。函數 reduceByKey,f
相關文章
相關標籤/搜索