貨款違約預測第二週週報

數據分析 上次主要查看了數據的類型以及是否缺失,這次數據分析首先查看各個特徵的基本統計量: 知道了各個特徵的一些基本統計量之後,先查找出數據中的對象特徵和數值特徵,再查看缺失數據的多少: 然後用一般的平均數來填充缺失值: 發現都已經填充完畢。 再用隨機森林模型填補就業年限數字: 之後再對部分特徵進行合併,以及對grade和subGrade進行手動編碼: 初步模型檢驗 利用最原始的數據來進行檢驗:
相關文章
相關標籤/搜索