機器學習中距離和相似性度量方法,基礎知識貼

原文出處: daniel-D 的博客(@迅猛龍Daniel )    在機器學習和數據挖掘中,我們經常需要知道個體間差異的大小,進而評價個體的相似性和類別。最常見的是數據分析中的相關分析,數據挖掘中的分類和聚類算法,如 K 最近鄰(KNN)和 K 均值(K-Means)等等。根據數據特性的不同,可以採用不同的度量方法。一般而言,定義一個距離函數 d(x,y), 需要滿足下面幾個準則: 1) d(x
相關文章
相關標籤/搜索