K-MEANS聚類

聚類術語無監督的學習,K-means算法是基於距離的聚類算法,採用 距離做爲類似性的評價指標,若是兩個文檔之間的距離越近那麼認爲兩個文檔的聚類越近。 算法: 1)初始化質心:從N個實驗文本中隨機選取K個文檔做爲質心 2)計算距離:對剩餘的每一個文本 計算其到每一個 質心的距離,並把它歸併到最近的質心的類 3)更新質心:從新計算已經獲得的各個類的質心 4)迭代條件:迭代2~3步直至新的質心與原 質心
相關文章
相關標籤/搜索