數據預處理之特徵選擇

特徵選擇的意義 在對數據進行異常值、缺失值、數據轉換等處理後,我們需要從當前數據集中選出有意義的特徵,然後輸入到算法模型中進行訓練。 對數據集進行特徵選擇主要基於以下幾方面的考慮: 1.冗餘的特徵會影響阻礙模型找尋數據潛在的規律,若冗餘的特徵過多,還會造成維度容災,佔用大量的時間空間,使算法運行效率大打折扣。 2.去除不相關的特徵會降低學習任務的難度,保留關鍵的特徵更能直觀的看出數據潛在的規律。
相關文章
相關標籤/搜索