Python機器學習及實踐從零開始通往Kaggle競賽之路之第二章 第四個程序使用k-nearst neighbors對iris數據集進行分類

前言: 本節主要測試K最近鄰(k-nearst neighbors) 對iris數據集分類的效果,K最近鄰算法的思想是在樣本未知的情況下,我首先選擇距離測試集最近的K個樣本,這K個樣本中哪個類別最多,我們就選擇該標籤歸給哪個數據集。代碼的流程圖是 1、加載數據集,包括將數據集劃分成測試集和訓練集 2、對數據集進行預處理,包括StandardScaler()標準化操作 3、調用K近鄰法,使用knn.
相關文章
相關標籤/搜索