基於Hadoop的Kmeans算法實現

時間 2019-12-06

原文原文鏈接

Kmeans算法是很典型的基於距離的聚類算法，採用距離做爲類似性的評價指標。即認爲兩個對象的距離越近，其類似度就越大。該算法認爲簇是由距離靠近的對象組成的，所以把獲得緊湊且獨立的簇做爲最終目標。java 算法流程以下：算法 1. 從N條數據中隨機選取K條數據做爲初始聚類中心；數組 2. 對剩餘的每條數據測量其到每一個聚類中心的距離，並將其歸到最近的中心的類；app

>>阅读原文<<