大數據學習筆記(三)-k-均值聚類&多維縮放找聚類

1.k-均值聚類 由於前面的幾種求聚類的算法,須要計算兩兩配對項的關係,在數據集大的時候,速度會很慢。因此咱們要學習k-均值聚類 算法思想:咱們會事先知道須要聚類的數量。這兒假設咱們須要n個聚類,那麼咱們先隨機生成n箇中心位置。而後利用聚類算法將各個數據項分配給最鄰近的中心位置,而後移動中心位置到聚類的平均位置處,而後循環以上步驟,知道分配過程再也不變化,那麼算法結束。返回n個聚類。具體代碼以下p
相關文章
相關標籤/搜索