小白數據挖掘進階之路2----(房租預測)數據清洗

上一節中我們已經大概瞭解了數據的分佈,這裏我們考慮如何對數據進一步處理**(數據清洗)**(比較難,需要花較多的時間去處理數據) 1.缺失值分析及處理 缺失值出現的原因分析,採取合適的方式對缺失值進行填充 2.異常值分析及處理 根據測試集數據的分佈處理訓練集的數據分佈,使用合適的方法找出異常值,對異常值進行處理 我們幾個模塊來進行分析: 1.加載一些必要的包,其中的一些包之前沒有接觸過,就自己查了
相關文章
相關標籤/搜索