算法之經常使用的距離和類似度度量

在數據分析和數據挖掘的過程當中,咱們常常須要知道個體間差別的大小,進而評價個體的類似性和類別。最多見的是數據分析中的相關分析,數據挖掘中的分類和聚類算法,如K最近鄰(KNN)和K均值(K-Means)。固然衡量個體差別的方法有不少,這裏整理羅列下。算法     爲了方便下面的解釋和舉例,先設定咱們要比較X個體和Y個體間的差別,它們都包含了N個維的特徵,即X=(x1, x2, x3, … xn),Y
相關文章
相關標籤/搜索