機器學習總結——數據預處理和特徵工程

實際生產中機器學習的整個過程應該是以下的幾步(後面還將從數據挖掘的角度另文進行講解):前端 1.場景選擇(算法選擇)——根據實際問題選擇合適的算法,是分類仍是迴歸等,是否須要作特徵抽象,或者特徵縮放;算法 2.數據預處理——缺失值的處理,數據清洗等等;後端 3.特徵工程——包括特徵構建、特徵提取、特徵選擇等;網絡 4.模型訓練——判斷過擬合和欠擬合,經過交叉驗證和grid research來選擇參
相關文章
相關標籤/搜索