特徵工程概略

並非原創,網上整理 特徵工程簡明圖 如上。特徵處理是特徵工程的核心部分,包括數據預處理、特徵選擇、降維等,通過sklearn的processing庫來實現。 數據預處理 不屬於同一量綱:無量綱化 信息冗餘:進行區間離散 定性特徵不能直接利用:採用啞編碼 存在缺失值:對缺失值進行補充 信息利用率低:對定量變量進行多項式化,增加新的特徵,可以達到非線性的結果。 無量綱化:即使不同規格的數據轉換到同一規
相關文章
相關標籤/搜索