面對數據缺失,如何選擇合適的機器學習模型?

本文來自AI新媒體量子位(QbitAI) 有些小夥伴在實際使用中發現xgboost可以自動處理缺失值,而有些模型不可以。我想先從兩個角度解答這個困惑: 工具包自動處理數據缺失不代表具體的算法可以處理缺失項 對於有缺失的數據:以決策樹爲原型的模型優於依賴距離度量的模型 回答中也會介紹樹模型,如隨機森林(Random Forest)和xgboost如何處理缺失值。文章最後總結了在有缺失值時選擇模型的小
相關文章
相關標籤/搜索