機器學習(1)-數據預處理

在對數據進行分析時,常常會遇到數據缺失或者異常的狀況 在這樣的數據多的狀況下刪掉數據終歸會對總體形成必定的影響 因此採起對數據進行處理的方法讓缺失或者異常的數據有數可用 例如用均值或者最值進行代替 本文便用少許的數據進行分析 下面的數據存在着缺失,數據表示的來自某一些國家的人的年齡,薪資,是否結婚 要知道:在python中缺失的數據默認是NaNpython 首先導入數據文件,設置數據文件的自變量X
相關文章
相關標籤/搜索