聚類實踐

聚類定義 聚類就是對大量未知標註的數據集,按數據的內在相似性將數據集劃分爲多個類別,使類別內的數據相似度較大而類別間的數據相似度較小。是無監督的分類方式。 數據的相似度度量方式 對無標識樣本聚類時,必須有一種衡量樣本之間相似度的方法或標準,通過這種標準來判斷不同樣本之間的相似性,進而來進行聚類。 1.歐式距離 p=1,dist(X,Y)=|x1-x2|+|y1-y2|,這時稱爲曼哈頓距離。 p=2
相關文章
相關標籤/搜索