機器學習之特徵工程

數據和特徵決定了機器學習的上限,而模型和算法只是逼近這個上限而已。特徵工程本質是一項工程活動,目的是最大限度地從原始數據中提取特徵以供算法和模型使用。通過總結和歸納,人們認爲特徵工程包括以下方面: 特徵處理是特徵工程的核心部分,特徵處理方法包括數據預處理,特徵選擇,降維等。 2 特徵提取:特徵提取是指將機器學習算法不能識別的原始數據轉化爲算法可以識別的特徵的過程。 實例解析:文本是由一系列文字組成
相關文章
相關標籤/搜索