K-近鄰分類法及tabulate、rng、categorical、varfun、discretize函數用法介紹

原理:簡單比喻爲——人以羣分,物以類聚。 優點:對於類域的交叉或重疊較多的待分樣本集來說,K-NN較其他方法更合適。 缺點:計算量較大,因爲會計算全體已知樣本的距離。 改進方法: (1)解決計算量大,事先對已知樣本點進行剪輯,去除對分類作用不大的成分。 (2)儘可能將計算壓縮到接近測試樣本領域的小範圍內,避免盲目地與訓練樣本集中的每個樣本進行距離計算。 算法步驟: (1)初始化距離爲最大值,計算未
相關文章
相關標籤/搜索