聚類分析常用算法原理:KMeans,DBSCAN, 層次聚類

聚類分析是非監督學習的很重要的領域。所謂非監督學習,就是數據是沒有類別標記的,算法要從對原始數據的探索中提取出一定的規律。而聚類分析就是試圖將數據集中的樣本劃分爲若干個不相交的子集,每個子集稱爲一個「簇」。下面是sklearn中對各種聚類算法的比較。 KMeans KMeans算法在給定一個數k之後,能夠將數據集分成k個「簇」 C={C1,C2,⋯,Ck} ,不論這種分類是否合理,或者是否有意義。
相關文章
相關標籤/搜索