數據挖掘學習-第二次打卡-數據EDA

目標:熟悉變量之間的相互關係,找到與預測值的聯繫,爲後續的特徵工程提供思路。 具體包括:查看數據總覽,查看缺失值和異常值,瞭解預測值的分佈,查看特徵變量的分佈,數字特徵和類別特徵分析(可視化)等。 按照資料中實現了一遍數據EDA,學習了一些可視化的技巧。詳細的步驟大致記錄如下。當然在最後可視化的時候也遇到了一些bug,還沒有完全解決。由於圖表太大,截取了幾個進行展示 對於數據的初步分析(直接查看數
相關文章
相關標籤/搜索