金融風控競賽筆記2-使用EDA粗略分析數據

查看缺失值 data_train.isnull().any().sum() # how many column is null 查看缺失特徵中缺失率大於5%的特徵 缺失列的可視化: 這裏缺失值很小,可以根據各列情況選擇填充。 另外可以橫向比較,如果在數據集中,某些樣本數據的大部分列都是缺失的且樣本足夠的情況下可以考慮刪除。 查看訓練集測試集中特徵屬性只有一值的特徵 查看特徵的數值類型有哪些,對象類
相關文章
相關標籤/搜索