TASK-2

nan是空缺值,統計空缺值的代碼: Train_data.isnull().sum() 缺省值用填補:假設用0 X_data = X_data.fillna(0) 缺省值可視化的作用:可以很直觀的瞭解哪些列存在 「nan」, 並可以把nan的個數打印,主要的目的在於 nan存在的個數是否真的很大,如果很小一般選擇填充,如果使用lgb等樹模型可以直接空缺,讓樹自己去優化,但如果nan存在的過多、可以
相關文章
相關標籤/搜索