機器學習算法系列(5):聚類的概念與模型

一.聚類的簡介 (一)引言 聚類屬於無監督學習,對大量未標註的數據集,按照數據內在相似性將數據集劃分爲多個類別,使類別內的數據相似度較大而類別間的數據相似度較小。 給定一個有N個對象的數據集,構造數據的K個簇,K≤N,同時滿足,每個簇至少包含一個對象,每一個對象屬於且僅屬於一個簇,將滿足上述條件的K個簇稱作一個合理劃分。它的主要思想是對於給定的類別數目K,首先給出初始劃分,通過迭代改變樣本和簇的隸
相關文章
相關標籤/搜索