機器學習之特徵工程{數據降微}

在數據預處理之後進行 這裏的維度指的是特徵值的數量,與pandas的維度不同。 方式有兩種:特徵選擇   主成分分析 特徵選擇 原因: 1.冗餘:部分特徵的相關度高,容易消耗計算機性能 2.噪聲:部分特徵對預測結果有負面影響 概念:         特徵選擇就是單純地從提取到的所有特徵中選擇部分特徵作爲訓練集特徵,特徵在選擇前和選擇後可以改變值,也可以不改變值。但是選擇後的維度一定比選擇前小,畢竟
相關文章
相關標籤/搜索