k-NN

k近鄰算法的工做原理: 存在一個樣本數據集合(訓練樣本集),而且樣本集中每一個數據都存在標籤,咱們知道樣本集中每一數據與所屬分類的對應關係。輸入沒有標籤的新數據後,將新數據的每一個特徵與樣本集中數據對應的特徵進行比較,而後算法提取樣本集中特徵最類似數據(最近鄰)的分類標籤。通常來講,咱們只選擇樣本數據集合中前k個最類似的數據,一般k是不大於20的整數。最後,選擇k個最類似數據中出現次數最多的分類,
相關文章
相關標籤/搜索