機器學習之聚類概述及評價指標

        聚類是一種無監督學習算法,訓練樣本的標記未知,按照某個標準或數據的內在性質及規律,將樣本劃分爲若干個不相交的子集,每個子集稱爲一個簇(cluster),每個簇中至少包含一個對象,每個對象屬於且僅屬於一個簇;簇內部的數據相似度較高,簇之間的數據相似度很低。聚類可以作爲分類等其他學習任務的前驅過程。         基於不同的學習策略,聚類算法可分爲多種類型:             
相關文章
相關標籤/搜索