scala經常使用操做

scala經常使用操做

版本信息
python3.7
pyspark2.4.0python

from pyspark import SQLContext,SparkContext,SparkConf

conf = SparkConf()
sc = SparkContext(conf=conf)
sqlContext = SQLContext(sc)
#加載csv文件
data = sqlContext.read.format("csv").option("header","true").load("union_order_user")
#按字段降序排序
sorted=data.sort("created_at",ascending = False)
#展現前100條記錄 默認展現20條
sorted.show(100)
相關文章
相關標籤/搜索