大數據:特徵工程

一、單變量特徵篩選 計算每個特徵與響應變量的相關性:工程上經常使用的手段有計算皮爾遜係數和互信息係數,皮爾遜係數只能衡量線性相關性而互信息係數可以很好地度量各類相關性,可是計算相對複雜一些,好在不少toolkit裏邊都包含了這個工具(如sklearn的MINE),獲得相關性以後就能夠排序選擇特徵了;web 二、單特徵模型篩選 構建單個特徵的模型,經過模型的準確性爲特徵排序,藉此來選擇特徵,另外,記
相關文章
相關標籤/搜索