特徵工程

特徵工程是一個任務驅動的經驗性處理過程 數據與特徵處理 特徵表達 數值型 類別型 時間型 文本型 統計型 組合特徵 數據的表示應當轉換爲更理想的格式 數值型 幅度調整/歸一化 Log等變化 統計值max,min,mean,std 離散化(一個特徵變多個特徵)(等距切分,等頻切分) Hash分桶 每個類別下對應的變量統計值histogram 試試 數值型=>類別型 類別型 獨熱編碼 啞變量 Hash
相關文章
相關標籤/搜索