大數據機器學習(四)K-近鄰算法

K-近鄰算法(K-nearest neighbor,KNN) 實質:找k個最近的鄰居,人多取勝(問題是k值該取多少怎麼確定) 三個基本要素: k值的選擇 距離度量 分類決策準則 k值的選擇 k小,模型複雜,容易過擬合,學習的估計誤差大 k大,學習的近似誤差會增大 距離度量 來個形象的圖表示一下 算法特點 • 優點 ①精度高 ②對異常值不敏感 ③無數據輸入假定 • 缺點 ① 計算複雜度高 ②空間複雜
相關文章
相關標籤/搜索