機器學習特徵選擇之卡方檢驗與互信息

by wangben  @ beijing測試 特徵選擇的主要目的有兩點:優化 1.      減小特徵數量提升訓練速度,這點對於一些複雜模型來講尤爲重要spa 2.      減小noisefeature以提升模型在測試集上的準確性。一些噪音特徵會致使模型出現錯誤的泛化(generalization),從而在測試集中表現較差。另外從模型複雜度的角度來看,特徵越多模型的複雜度越高,也就越容易發生o
相關文章
相關標籤/搜索