聚類分析 - K-means - Python代碼實現

算法簡介 K-means算法是很典型的基於距離的聚類算法,採用距離做爲類似性的評價指標,即認爲兩個對象的距離越近,其類似度就越大。該算法認爲簇是由距離靠近的對象組成的,所以把獲得緊湊且獨立的簇做爲最終目標。python 算法過程以下:算法 1)從N個文檔隨機選取K個文檔做爲中心點;併發 2)對剩餘的每一個文檔測量其到每一箇中心點的距離,並把它歸到最近的質心的類;大數據 3)從新計算已經獲得的各個類
相關文章
相關標籤/搜索