機器學習常見問題及解決方案——特徵選擇方法

1、特徵工程 數據和特徵決定了機器學習的上限,而模型和算法只是逼近這個上限而已,特徵工程就是最大限度地從原始數據中提取特徵以供算法和模型使用,通過歸納和總結,特徵工程大體包含以下方面: 特徵處理是特徵工程的核心部分,scikit-learn提供了較爲完整的特徵處理方法,包括數據預處理、特徵選擇、降維等。 2、數據預處理 通過特徵提取,我們能得到未處理的特徵,這是的特徵有以下顯著特點: 不屬於同一量
相關文章
相關標籤/搜索