kmeans實現文本聚類

需求 拿到的需求是輸入n個文本,對文本進行聚類,由於這些輸入不能通過歷史數據進行訓練,所以這個主要就是用無監督學習來解決。 kmeans 談到聚類就會想到kmeans,它的核心思想是給定的K值和K個初始質心將樣本中每個點都分到距離最近的類簇中,當所有點分配完後根據每個類簇的所有點重新計算質心,一般是通過平均值計算,然後再將每個點分到距離最近的新類簇中,不斷循環此操作,直到質心不再變化或達到一定的迭
相關文章
相關標籤/搜索