百面機器學習——第一章特徵工程

特徵工程:是對原始數據進行一系列工程處理,將其提煉爲特徵,作爲輸入供算法和模型使用。從本質上來講,特徵工程是一個表示和展現數據的過程。在實際工作中,特徵工程旨在去除原始數據中的雜質和冗餘,設計更高效的特徵以刻畫求解的問題和預測模型之間的關係。 對於機器學習問題,數據和特徵往往決定了結果的上限,而算法,模型的選擇及優化則是在逐步接近這個上限。特徵工程的框架圖: 常用的數據類型: (1)結構化數據:可
相關文章
相關標籤/搜索