高級實訓第二週週報

實踐:     對部分有缺失值的特徵做了簡單的填充處理(數值類用均值替代,類別類用衆數替代),重點選取部分與貸款數額、評級、收入與償還能力相關的屬性,使用KNN模型進行訓練(因其較簡單,運行速度較快)。由於測試集不含標籤,我使用sklearn將原訓練集隨機劃分爲訓練集、測試集,其中測試集佔比爲0.3,即240000條,在測試集上準確率約爲0.79,賽事評分如下:   理論:     閱讀了論壇中關
相關文章
相關標籤/搜索