機器學習總結——數據預處理和特徵工程

實際生產中機器學習的整個過程應該是如下的幾步(後面還將從數據挖掘的角度另文進行講解): 1.場景選擇(算法選擇)——根據實際問題選擇合適的算法,是分類還是迴歸等,是否需要做特徵抽象,或者特徵縮放; 2.數據預處理——缺失值的處理,數據清洗等等; 3.特徵工程——包括特徵構建、特徵提取、特徵選擇等; 4.模型訓練——判斷過擬合和欠擬合,通過交叉驗證和grid research來選擇參數,調整模型複雜
相關文章
相關標籤/搜索