Spark應用HanLP對中文語料進行文本挖掘--聚類

軟件:IDEA2014、Maven、HanLP、JDK; 用到的知識:HanLP、Spark TF-IDF、Spark kmeans、Spark mapPartition; 用到的數據集:http://www.threedweb.cn/thread-1288-1-1.html(不需要下載,已經包含在工程裏面); 工程下載:https://github.com/fansy1990/hanlp-tes
相關文章
相關標籤/搜索