數據挖掘之特徵選擇

by wangben @ beijing 數據挖掘之特徵選擇 特徵選擇的主要目的有兩點: 1. 減少特徵數量提高訓練速度,這點對於一些複雜模型來說尤其重要 2. 減少noisefeature以提高模型在測試集上的準確性。一些噪音特徵會導致模型出現錯誤的泛化(generalization),從而在測試集中表現較差。另外從模型複雜度的角度來看,特徵越多模型的複雜度越高,也就越容易發生overfitti
相關文章
相關標籤/搜索