k-means缺陷

k均值算法很是簡單且使用普遍,可是存在的缺陷有: 
1. K值須要預先給定;算法

  屬於預先知識,不少狀況下K值的估計很是困難。 
2. K-Means算法對初始選取的聚類中心點是敏感的;spa

  不一樣的隨機種子點獲得的聚類結果徹底不一樣 
3. K均值算法並不適合全部的數據類型;數據類型

  不能處理非球形簇、不一樣尺寸和不一樣密度的簇。 
4. 對離羣點的數據進行聚類時,K均值也存在問題,這種狀況下,離羣點檢測和刪除有很大的幫助。數據