數據挖掘實訓週報week2

本週比賽主要進行了數據的預處理階段。 EDA價值主要在於熟悉瞭解整個數據集的基本情況(缺失值,異常值),對數據集進行驗證是否可以進行接下來的機器學習或者深度學習建模.瞭解變量間的相互關係、變量與預測值之間的存在關係。 第一步先進行變量分類和缺失值處理。 缺沒有的填補爲0、 查看數據分佈比例 剔除不好的數據分佈 對異常的數據進行正態處理 之後進行的建模過程,由於選擇的模型出現問題 目前還在解決 暫時
相關文章
相關標籤/搜索