K-means算法及文本聚類實踐

K-Means是常用的聚類算法,與其他聚類算法相比,其時間複雜度低,聚類的效果也還不錯,這裏簡單介紹一下k-means算法,下圖是一個手寫體數據集聚類的結果。  基本思想  k-means算法需要事先指定簇的個數k,算法開始隨機選擇k個記錄點作爲中心點,然後遍歷整個數據集的各條記錄,將每條記錄歸到離它最近的中心點所在的簇中,之後以各個簇的記錄的均值中心點取代之前的中心點,然後不斷迭代,直到收斂,算
相關文章
相關標籤/搜索