機器學習(九)聚類K-means

什麼是聚類 聚類就是對大量未知標註的數據集,按照數據內部存在的數據特徵將數據集劃分爲多個不同的類別,使類別內的數據比較相似,類別之間的數據相似度比較小; 屬於無監督學習  聚類算法的重點是計算樣本項之間的相似度,有時候也稱爲樣本間的距離  和分類算法的區別: 分類算法是有監督學習,基於有標註的歷史數據進行算法模型構建 聚類算法是無監督學習,數據集中的數據是沒有標註的 相似度/距離公式 pearso
相關文章
相關標籤/搜索