聚類分析(二)——二分K均值

一般的K均值,所分成的簇往往是局部最優,而不是全局最優,比如下圖,簇也不會再更新了,但顯然沒達到我們的要求。 算法思想: 顧名思義,二分k均值就是每次將數據集一分爲二,即k均值算法中的k值爲2,第一次是在整個數據集上劃分,這裏沒什麼異議,從第二次開始,每次劃分的時候就要選取使整個數據集誤差平方和最小的一個類進行一分爲二了,以此進行下去直到分成我們想要的k類。 二分k均值的僞代碼如下: 將所有點看成
相關文章
相關標籤/搜索