機器學習案例系列教程——距離度量方法總結

  在數據挖掘中,不管是對數據進行分類、聚類仍是異常檢測、關聯性分析,都創建在數據之間類似性或相異性的度量基礎上。一般使用距離做爲數據之間類似性或相異性的度量方法,經常使用的度量方法有歐式距離、曼哈頓距離、切比雪夫距離、閔可夫斯基距離、漢明距離、餘弦距離、馬氏距離、Jaccard係數、相關係數、信息熵。web 歐式距離   n維空間中兩個樣本點x和y之間的歐幾里得距離定義以下: svg d(x,y
相關文章
相關標籤/搜索