聚類分析 - K-means - Python代碼實現

時間 2020-05-12

原文原文鏈接

算法簡介 K-means算法是很典型的基於距離的聚類算法，採用距離做爲類似性的評價指標，即認爲兩個對象的距離越近，其類似度就越大。該算法認爲簇是由距離靠近的對象組成的，所以把獲得緊湊且獨立的簇做爲最終目標。python 算法過程以下：算法 1）從N個文檔隨機選取K個文檔做爲中心點；併發 2）對剩餘的每一個文檔測量其到每一箇中心點的距離，並把它歸到最近的質心的類；大數據 3）從新計算已經獲得的各個類

>>阅读原文<<