ML-k鄰近算法(kNN)

  1. 定義:採用測量不一樣特徵值之間的距離方法進行分類。
  2. 優勢:精度高,對異常值不敏感,無數據輸入假定。
  3. 缺點:計算複雜度高,空間度高。
  4. 適用數據範圍: 數值型和標稱型。
  5. 工做原理: 存在一個樣本數據集合,而且樣本中每一個數據都存在標籤,輸入沒有標籤的數據後,將新數據的每一個特徵值與樣本集中的每一個特徵值比對,而後算法提取樣本中特徵值最類似數據(最近鄰)的分類標籤。最後選擇k個最類似數據中出現次數最多的分類,做爲最新的分類。
相關文章
相關標籤/搜索