特徵工程基礎

大綱 可用性評估:獲取難度、覆蓋率、準確率 特徵清洗:清洗異常樣本 採樣:數據不均衡、樣本權重 單個特徵:無量綱化(標準化、歸一化)、二值化、離散化、缺失值(均值)、 - 啞編碼(一個定性特徵擴展爲N個定量特徵) 數據變換:log、指數、Box-Cox 降維:主成分分析PCA、線性判別分析LDA、SVD分解 特徵選擇:Filter(相關係數、卡方檢驗)、Wrapper(AUC、設計評價函數A*、E
相關文章
相關標籤/搜索