特徵工程與數據預處理

特徵工程與數據預處理 1. 特徵工程定義 通常而言,特徵選擇是指選擇獲得相應模型和算法最好性能的特徵集。數據和特徵決定了機器學習的上限,而模型和算法只是逼近這個上限而已。 從這個概念可以看出,特徵工程其實是一個如何展示和表現數據的問題,在實際工作中需要把數據以一種「良好」的方式展示出來,使得能夠使用各種各樣的機器學習模型來得到更好的效果。如何從原始數據中去除不佳的數據,展示合適的數據就成爲了特徵工
相關文章
相關標籤/搜索