機器學習之聚類（二）

時間 2021-01-08

原文原文鏈接

在機器學習和數據挖掘中，我們經常需要知道個體間差異的大小，進而評價個體的相似性和類別。最常見的是數據分析中的相關分析，數據挖掘中的分類和聚類算法，如 K 最近鄰（KNN）和 K 均值（K-Means）等等。根據數據特性的不同，可以採用不同的度量方法。一般而言，定義一個距離函數 d(x,y), 需要滿足下面幾個準則： 1) d(x,x) = 0 // 到自己

>>阅读原文<<