機器學習深入與強化--工作流程與模型優化

實際建模之前,需要做數據的處理,首先是數據清洗,2點,然後是數據採樣,因爲大部分模型對正負樣本的比例都十分敏感。 之後非常重要的就是特徵工程,它包括特徵處理和特徵選擇兩部分,首先是特徵處理,針對不同類型的特徵值進行處理。特徵選擇包括 過濾型、包裹型和內嵌型,過濾型考慮單個特徵與y值之間的相關度,挑選最相關的特徵留下來。包裹型是指逐步取特徵的子集,在子集上跑算法,看效果是否比在特徵全集上好,比如準確
相關文章
相關標籤/搜索