機器學習--特徵工程

一、爲什麼要做特徵工程? 在工業也流行着一句話:「數據和特徵決定了機器學習的上限,而模型和算法知識逼近這個上限的方式」,由此可見,擁有適用於當前問題的數據和特徵是至關重要的,因此做特徵工程目的就是擁有更加適合當前問題的數據和特徵。 二、數據預處理 2.1 缺失錯誤值處理 錯誤值處理方式:前期收集數據,數據源來源不同,可能造成數據格式不統一,需要統一格式;對於數值型的數據,某個樣本出現字符型數據,可
相關文章
相關標籤/搜索