機器學習算法與Python實踐之(五)k均值聚類(k-means)

一、k-means算法        通常,人們根據樣本間的某種距離或者相似性來定義聚類,即把相似的(或距離近的)樣本聚爲同一類,而把不相似的(或距離遠的)樣本歸在其他類。        我們以一個二維的例子來說明下聚類的目的。如下圖左所示,假設我們的n個樣本點分佈在圖中所示的二維空間。從數據點的大致形狀可以看出它們大致聚爲三個cluster,其中兩個緊湊一些,剩下那個鬆散一些。我們的目的是爲這些
相關文章
相關標籤/搜索