用R語言實現文本挖掘（tm）、聚類

時間 2020-01-22

標籤語言實現文本挖掘欄目大數據简体版

原文原文鏈接

最近由於寫畢業論文，想要找找怎樣可以識別不相干方法評論，結果看到了R語言中使用K-mean聚類，能夠查看不在聚類範圍類的，輸出異常的評論。因爲K-mean聚類是針對數值型數據的，因此在運用K-mean聚類算法對文本進行主題聚類時，須要經歷分詞、詞向量、文檔-詞矩陣等，用到了幾個包。我原先針對這部分的文本分析主要時用Python中的結巴工具分詞、提出關鍵詞、LDA主題分類等方法。今天想要試試用R語言

>>阅读原文<<

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。