ML03 -- 數據預處理和特徵工程

數據預處理和特徵工程 數據不給力,再高級的算法都沒用 數據挖掘的五大流程 1.獲取數據 2.數據預處理 從數據中檢測糾正或刪除不準確或不適用於模型的記錄的過程,讓數據適應模型,匹配模型的需求。 會處理數據類型不同,數據偏態數據異常、缺失、噪點、量綱不一、重複等等 3.特徵工程 將原始數據轉換爲更能代表預測模型的潛在問題的特徵的過程。可以通過挑選最相關的特徵,提取特徵以及創造特徵來實現。 可能面對的
相關文章
相關標籤/搜索