聚類算法彙總

作爲無監督領域(unsupervised)一個太過famous的算法了,聚類(clustering)就是對大量未知標註的數據集,按照數據的內在相似性將數據集劃分爲多個類別,使類別內的數據相似度較大而類別間的數據相似度較小. 然而,裏面仍然有很多需要注意的地方,對於聚類本身,目前也有很多改進版本了,所以還是需要總結一下的。 相似度的度量 各種相似度的度量方式及其相關性見我的這篇博客。 K-means
相關文章
相關標籤/搜索