項目學習01--用戶畫像

1.賽題解讀 預測目標(中國移動信用解釋) 2.數據探索分析(EDA) 2.1數據基本情況:缺失值,各字段數據類型、數值型字段的統計分佈 年齡爲0,可能是主辦方對缺失值數據填充,年齡大於100可能是異常數據 2.2觀察變量的密度曲線(觀察特徵分佈,爲特徵工程做準備) 大部分的用戶近六個月的消費值在200以內,左偏 個別的點可以被當作是異常值進行處理,避免過擬合,或者訓練和測試不是同分布等情況 2.
相關文章
相關標籤/搜索