機器學習算法與Python實踐之（五）k均值聚類（k-means）

時間 2021-01-07

原文原文鏈接

一、k-means算法通常，人們根據樣本間的某種距離或者相似性來定義聚類，即把相似的（或距離近的）樣本聚爲同一類，而把不相似的（或距離遠的）樣本歸在其他類。我們以一個二維的例子來說明下聚類的目的。如下圖左所示，假設我們的n個樣本點分佈在圖中所示的二維空間。從數據點的大致形狀可以看出它們大致聚爲三個cluster，其中兩個緊湊一些，剩下那個鬆散一些。我們的目的是爲這些

>>阅读原文<<