機器學習--kNN算法

最近看完了Machine Learning in Action對kNN的介紹,應該說是簡單易懂的,在這裏記錄一些要點。算法

##kNN介紹ide

參看Wiki函數

##kNN的特色測試

  • 簡單
  • 有監督 分類算法
  • 無須訓練
  • 數據須要歸一化
  • k最好取奇數,避免平等投票
  • 若是樣本和特徵多的話,計算量大(致使預測速度慢)
  • 數值和標稱均可以用

##距離函數idea

  • 歐氏距離(Euclidean distance)rest

  • 曼哈頓距離(Manhattan distance)
    兩個向量的份量差的絕對值的總和ip

  • 餘弦距離(待研究)get

  • 漢明距離(待研究)it

##改進算法io

##實用性 這個算法給我最大的疑惑就是什麼地方能派上用場,憑感受只能用在一些很簡單的場景。好比書上有個數字識別的例子,我手寫了幾個,放進去測試,結果不好。

相關文章
相關標籤/搜索