pyspark經常使用的基本操做

一.經過外部數據建立RDD # 1.經過本地數據建立RDD # 準備本地文件 cat myspark.txt >hello my name is Cocktail_py >welcome to my blogs # pyspark shell rdd = sc.textFile("file:////root/myspark.txt") rdd.collect() >['hello my nam
相關文章
相關標籤/搜索