用R語言實現文本挖掘(tm)、聚類

最近由於寫畢業論文,想要找找怎樣可以識別不相干方法評論,結果看到了R語言中使用K-mean聚類,能夠查看不在聚類範圍類的,輸出異常的評論。因爲K-mean聚類是針對數值型數據的,因此在運用K-mean聚類算法對文本進行主題聚類時,須要經歷分詞、詞向量、文檔-詞矩陣等,用到了幾個包。我原先針對這部分的文本分析主要時用Python中的結巴工具分詞、提出關鍵詞、LDA主題分類等方法。今天想要試試用R語言
相關文章
相關標籤/搜索