機器學習算法系列(5)：聚類的概念與模型

時間 2021-01-13

標籤機器學習聚類算法 Kmeans 简体版

原文原文鏈接

一.聚類的簡介（一）引言聚類屬於無監督學習，對大量未標註的數據集，按照數據內在相似性將數據集劃分爲多個類別，使類別內的數據相似度較大而類別間的數據相似度較小。給定一個有N個對象的數據集，構造數據的K個簇，K≤N，同時滿足，每個簇至少包含一個對象，每一個對象屬於且僅屬於一個簇，將滿足上述條件的K個簇稱作一個合理劃分。它的主要思想是對於給定的類別數目K，首先給出初始劃分，通過迭代改變樣本和簇的隸

>>阅读原文<<