機器學習之十大經典算法(一)KNN算法

     分類思想比較簡單,從訓練樣本中找出 K 個與其最相近的樣本,然後看這 k 個樣本中哪個類別的樣本多,則待判定的值(或說抽樣)就屬於這個類別。     缺點:        1)K 值需要預先設定,而不能自適應,一般選擇20,如果數據量小的話,可以調參。       2)當樣本不平衡時,如一個類的樣本容量很大,而其他類樣本容量很小時,有可能導致當輸入一個新樣本時,該樣本的 K 個鄰居中大容
相關文章
相關標籤/搜索