貸款違約預測-數據分析

EDA價值主要在於熟悉瞭解整個數據集的基本情況(缺失值,異常值),對數據集進行驗證是否可以進行接下來的機器學習或者深度學習建模。 瞭解變量間的相互關係、變量與預測值之間的存在關係。 爲特徵工程做準備。 1.總體瞭解 查看數據集的樣本個數和原始特徵維度 訓練集:(80w,47);測試集:(20w,47) 通過info來查看空值情況;通過describe查看各個特徵一些基本統計量 2.查看數據集中特徵
相關文章
相關標籤/搜索