聚類算法概述及相關距離度量公式

一、概述 首先:聚類算法是無監督學習算法;一般構建用戶興趣屬性畫像等可應用聚類算法;而一般的分類算法是有監督學習,基於有標註的歷史數據進行算法模型構建 定義:對大量未知標註的數據集,按照數據內部存在的數據特徵將數據集劃分爲多個不用的類別,使得類別內的數據比較相似,類別間的數據相似度較小。重點是計算樣本之間的相似度,有時候也稱爲樣本間的距離。 二、常用的距離公式: 1、閔可夫斯基距離公式,距離越近代
相關文章
相關標籤/搜索