Spark詞頻統計測試(白話版二十四史)

數據:中華書局白話版二十四史,總計大小93M,已經存放到HDFS集羣pythonSpark 1.6.0jieba(結巴分詞)D3.JSfrom  pyspark import SparkConf, SparkContext第一個被授予節度使稱號的是唐睿宗(武則天的兒子)時期的左武衛大將軍兼幽州都督薛訥,他也是大名鼎鼎的薛仁貴的兒子。
相關文章
相關標籤/搜索