spark機器學習-聚類

聚類算法是一種無監督學習任務,用於將對象分到具備高度類似性的聚類中,聚類算法的思想簡單的說就是物以類聚的思想,相同性質的點在空間中表現的較爲緊密和接近,主要用於數據探索與異常檢測,最經常使用的一種聚類算法是K均值(K-means)聚類算法 算法原理 kmeans的計算方法以下: 1 選取k箇中心點 2 遍歷全部數據,將每一個數據劃分到最近的中心點中 3 計算每一個聚類的平均值,並做爲新的中心點 4
相關文章
相關標籤/搜索