基於Hadoop的Kmeans算法實現

    Kmeans算法是很典型的基於距離的聚類算法,採用距離做爲類似性的評價指標。即認爲兩個對象的距離越近,其類似度就越大。該算法認爲簇是由距離靠近的對象組成的,所以把獲得緊湊且獨立的簇做爲最終目標。java     算法流程以下:算法     1. 從N條數據中隨機選取K條數據做爲初始聚類中心;數組     2. 對剩餘的每條數據測量其到每一個聚類中心的距離,並將其歸到最近的中心的類;app
相關文章
相關標籤/搜索