特徵選擇與特徵組合

特徵選擇 特徵選擇是特徵工程中的重要問題(另一個重要的問題是特徵提取),坊間常說:數據和特徵決定了機器學習的上限,而模型和算法只是逼近這個上限而已。由此可見,特徵工程尤其是特徵選擇在機器學習中佔有相當重要的地位。通常而言,特徵選擇是指選擇獲得相應模型和算法最好性能的特徵集,工程上常用的方法有以下: 1. 計算每一個特徵與響應變量的相關性:工程上常用的手段有計算皮爾遜係數和互信息係數,皮爾遜係數只能
相關文章
相關標籤/搜索