機器學習-特徵工程與模型評估1

特徵工程概論 特徵工程的目的 最大限度地從原始數據中提取特徵以供算法和模型使用。 引用工業界的一句話:數據和特徵決定了機器學習的上限,而模型和算法只是逼近這個上限而已。 數據預處理 特徵工程 數據清洗 數據清洗的具體內容 在特徵工程裏有一個詞:「髒數據」,很可能是數據採集中的問題所導致的不正常數據。 怎麼清洗髒數據 根據理論經驗或者實際情況設定一個預定的閾值,在閾值之外的即視爲髒數據; 根據均值方
相關文章
相關標籤/搜索