特徵工程-特徵選擇、特徵表達、特徵預處理

特徵工程是數據分析中最耗時間和精力的一部分工作,它不像算法和模型那樣是確定的步驟,更多是工程上的經驗和權衡。因此沒有統一的方法。這裏只是對一些常用的方法做一個總結。本文關注於特徵選擇部分。後面還有兩篇會關注於特徵表達和特徵預處理。一、特徵選擇1. 特徵的來源 在做數據分析的時候,特徵的來源一般有兩塊, 一塊是業務已經整理好各種特徵數據,我們需要去找出適合我們問題需要的特徵; 另一塊是我們從業務特徵
相關文章
相關標籤/搜索