機器學習之聚類(二)

  在機器學習和數據挖掘中,我們經常需要知道個體間差異的大小,進而評價個體的相似性和類別。最常見的是數據分析中的相關分析,數據挖掘中的分類和聚類算法,如 K 最近鄰(KNN)和 K 均值(K-Means)等等。根據數據特性的不同,可以採用不同的度量方法。一般而言,定義一個距離函數 d(x,y), 需要滿足下面幾個準則: 1) d(x,x) = 0                    // 到自己
相關文章
相關標籤/搜索