knn/kmeans/kmeans++/Mini Batch K-means/Affinity Propagation/Mean Shift/層次聚類/DBSCAN 區別

能夠看出來除了KNN之外其餘算法都是聚類算法html

1.knn/kmeans/kmeans++區別算法

先給你們貼個簡潔明瞭的圖，好幾個地方都看到過，我也不知道到底誰是原做者啦，若是侵權麻煩聯繫我咯~~~~spa

knn模型的三要素：距離度量（如何計算樣本之間的距離）、k值的選擇（選擇要判斷的目標周圍的幾個樣本去判斷類別）、分類決策規則（如何決定目標的類別）.net

圖中所謂沒有明顯的訓練過程就是給定目標樣本，只須要直接計算其周圍K個樣本的類別，經過分類決策規則判斷出來目標樣本的類別就能夠，不須要預先訓練一個判別模型。htm

Kmeans算法的缺陷blog

上面就引出了kmeans++，也就是選擇初始種子究竟是哪一個樣本時（主要不是選擇中心個數，而是人爲給定聚類個數，初始化具體哪些樣本爲初始質心），不是像kmeans那樣隨機選擇，而是：初始的聚類中心之間的相互距離要儘量的遠。class

上面這部分主要是參考 https://blog.csdn.net/loadstar_kun/article/details/39450615im

2.其他聚類算法間的區別數據

參考連接 http://blog.sina.com.cn/s/blog_7103b28a0102w4e1.html （我尚未細看，下次再補充~~~~~~~）img