聚類分析:1.相似性測度

相似性測度就是爲聚類進行服務的,通過相似性測度來進行聚類。 一個樣本都是一個n維向量,在空間中就是一個點,即座標,所以兩個樣本相似就是兩個點的距離相近。 在正式講解具體的距離測度方法,這裏現講兩種常用的兩種運算: 歐式距離是最常用的相似性測度方法,但也存在缺陷,就是不同的向量尺度裏結果是不一樣的,即向量分值的單位不同,如一個是L,另一個是ml,算出來的聚類結果可能是不一樣的,可以通過數據歸一化處理
相關文章
相關標籤/搜索