機器學習實戰——使用k近鄰算法改進約會網站的配對效果

整個示例總的來說沒什麼難度,就是先將文本文件進行解析,將文本文件中的數據分割成數據集和標籤集 函數如下: 將文本文件解析完成後,我們需要考慮一個問題,就是如果就直接拿這個數據集去訓練,由於各個屬性的值不一致,數量級差別比較大,而我們又是根據距離的大小來判斷類別的 這樣自然造成數量級比較大的屬性的在最後的結果中影響較大,這不是我們所希望的結果,故我們需要將整個訓練集進行歸一化之後,再進行訓練。歸一化
相關文章
相關標籤/搜索