版本信息
python3.7
pyspark2.4.0python
from pyspark import SQLContext,SparkContext,SparkConf conf = SparkConf() sc = SparkContext(conf=conf) sqlContext = SQLContext(sc) #加載csv文件 data = sqlContext.read.format("csv").option("header","true").load("union_order_user") #按字段降序排序 sorted=data.sort("created_at",ascending = False) #展現前100條記錄 默認展現20條 sorted.show(100)