knn/kmeans/kmeans++/Mini Batch K-means/Affinity Propagation/Mean Shift/層次聚類/DBSCAN 區別

能夠看出來除了KNN之外其餘算法都是聚類算法html

1.knn/kmeans/kmeans++區別算法

先給你們貼個簡潔明瞭的圖,好幾個地方都看到過,我也不知道到底誰是原做者啦,若是侵權麻煩聯繫我咯~~~~spa

knn模型的三要素:距離度量(如何計算樣本之間的距離)、k值的選擇(選擇要判斷的目標周圍的幾個樣本去判斷類別)、分類決策規則(如何決定目標的類別).net

圖中所謂沒有明顯的訓練過程就是給定目標樣本,只須要直接計算其周圍K個樣本的類別,經過分類決策規則判斷出來目標樣本的類別就能夠,不須要預先訓練一個判別模型。htm

Kmeans算法的缺陷blog

  • 聚類中心的個數K 須要事先給定,但在實際中這個 K 值的選定是很是難以估計的,不少時候,事先並不知道給定的數據集應該分紅多少個類別才最合適
  • Kmeans須要人爲地肯定初始聚類中心,不一樣的初始聚類中心可能致使徹底不一樣的聚類結果。(可使用Kmeans++算法來解決)

上面就引出了kmeans++,也就是選擇初始種子究竟是哪一個樣本時(主要不是選擇中心個數,而是人爲給定聚類個數,初始化具體哪些樣本爲初始質心),不是像kmeans那樣隨機選擇,而是:初始的聚類中心之間的相互距離要儘量的遠。class

上面這部分主要是參考 https://blog.csdn.net/loadstar_kun/article/details/39450615im

2.其他聚類算法間的區別數據

參考連接 http://blog.sina.com.cn/s/blog_7103b28a0102w4e1.html (我尚未細看,下次再補充~~~~~~~)img

相關文章
相關標籤/搜索