機器學習實戰——使用k近鄰算法改進約會網站的配對效果

時間 2020-12-23

原文原文鏈接

整個示例總的來說沒什麼難度，就是先將文本文件進行解析，將文本文件中的數據分割成數據集和標籤集函數如下：將文本文件解析完成後，我們需要考慮一個問題，就是如果就直接拿這個數據集去訓練，由於各個屬性的值不一致，數量級差別比較大，而我們又是根據距離的大小來判斷類別的這樣自然造成數量級比較大的屬性的在最後的結果中影響較大，這不是我們所希望的結果，故我們需要將整個訓練集進行歸一化之後，再進行訓練。歸一化

>>阅读原文<<