特徵工程的步驟與理解

特徵工程是在原有數據的特徵下,通過想象力以及對數據的理解和一些特徵組合形成新的特徵,再對特徵評估,優勝劣汰,取出能利用的特徵提供給模型建模。 特徵工程的常用手段: 1.通過箱型圖: 文章中的數據特徵比較多,特徵看圖就可。 通過箱型圖,可以剔除某些特徵,比如說,第一張圖第三行的第二列,樣本非常不均衡,說明該特徵無意義,還要第二張圖第一行第四列,該特徵的數據對預測值沒有參考意義,分佈相同,沒有區別。
相關文章
相關標籤/搜索