特徵工程之特徵選擇

特徵工程是數據分析中最耗時間和精力的一部分工作,它不像算法和模型那樣是確定的步驟,更多是工程上的經驗和權衡。因此沒有統一的方法。這裏只是對一些常用的方法做一個總結。本文關注於特徵選擇部分。後面還有兩篇會關注於特徵表達和特徵預處理。 1. 特徵的來源 在做數據分析的時候,特徵的來源一般有兩塊,一塊是業務已經整理好各種特徵數據,我們需要去找出適合我們問題需要的特徵;另一塊是我們從業務特徵中自己去尋找高
相關文章
相關標籤/搜索