特徵選擇 (feature_selection)

當數據預處理完成後,咱們須要選擇有意義的特徵輸入機器學習的算法和模型進行訓練。一般來講,從兩個方面考慮來選擇特徵:html 特徵是否發散:若是一個特徵不發散,例如方差接近於0,也就是說樣本在這個特徵上基本上沒有差別,這個特徵對於樣本的區分並無什麼用。 特徵與目標的相關性:這點比較顯見,與目標相關性高的特徵,應當優選選擇。除移除低方差法外,本文介紹的其餘方法均從相關性考慮。 根據特徵選擇的形式又能夠
相關文章
相關標籤/搜索