新手探索NLP(十二)——文本聚類

簡介 聚類又稱羣分析,是數據挖掘的一種重要的思想,聚類(Cluster)分析是由若干模式(Pattern)組成的,通常,模式是一個度量(Measurement)的向量,或者是多維空間中的一個點。聚類分析以相似性爲基礎,在一個聚類中的模式之間比不在同一聚類中的模式之間具有更多的相似性。 文本聚類其實也就是在文本方向上的應用,首先我們要把一個個文檔的自然語言轉換成數學信息,這樣形成高維空間點之後再去計
相關文章
相關標籤/搜索