Bryan直播:sklearn入門:數據預處理、模型評估、模型融合——學習筆記

1.預處理 當我們拿到一批原始數據以後,需要考慮以下問題: 1)首先要明確有多少特徵,哪些是連續的,哪些是類別特徵。 2)檢查有沒有缺失值,選擇合適的缺失值填補方法,使數據保持完整。 3)對連續的數值型變量進行 標準化,使得均值爲0,方差爲1。 4)對類別型的特徵進行 one-hot編碼。 5)將需要轉換成類別型數據的連續型數據進行 二值化。 6)爲防止過擬合或者其他原因,選擇是否要將數據進行 正
相關文章
相關標籤/搜索