特徵工程——一個粗糙調研

1.  數據預處理 通過特徵提取,我們能得到未經處理的特徵,這時的特徵可能有以下問題: 1) 不屬於同一量綱:即特徵的規格不一樣,不能夠放在一起比較。  ——無量綱化 無量綱化使不同規格的數據轉換到同一規格: 標準化(Z-Score):前提是特徵值服從正態分佈,標準化後,其轉換成標準正態分佈。 區間縮放法(min-max標準化):利用邊界值信息,將特徵的取值區間縮放到某個特定的範圍,例如[0, 1
相關文章
相關標籤/搜索