機器學習過程中的數據預處理和特徵選擇方法

1、數據清洗 數據清洗(data cleaning)是在機器學習過程中一個不可缺少的環節,其數據的清洗結果直接關係到模型效果以及最終的結論。在實際的工作中,數據清洗通常佔開發過程的50%-80%左右的時間。 數據清洗過程: (1)數據預處理 在數據預處理過程主要考慮兩個方面,如下: 選擇數據處理工具:關係型數據庫或者Python 查看數據的元數據以及數據特徵:一是查看元數據,包括字段解釋、數據來源
相關文章
相關標籤/搜索