機器學習筆記(12)— K均值算法

本文主要介紹K均值的運行原理、代價函數、聚類數量的選擇等內容。 1.運行原理 假如有以下數據集,並且要將其分爲兩類。 首先使用生成兩個聚類中心(圖中的紅藍點)。之後該算法會計算每個樣本點和兩個聚類中心的距離,根據距離的遠近把樣本點分配給聚類中心。 第一次聚類之後的結果如下: 之後K-均值算法根據之前計算出來的距離移動聚類中心,移動之後的結果如下所示。 之後重複之前的過程,完成聚類。 通過以上例子,
相關文章
相關標籤/搜索