面對數據缺失,如何選擇合適的機器學習模型?

作者:阿薩姆 普華永道 | 數據科學家 量子位 已獲授權編輯發佈 轉載請聯繫原作者 有些小夥伴在實際使用中發現xgboost可以自動處理缺失值,而有些模型不可以。我想先從兩個角度解答這個困惑: 工具包自動處理數據缺失不代表具體的算法可以處理缺失項 對於有缺失的數據:以決策樹爲原型的模型優於依賴距離度量的模型 回答中也會介紹樹模型,如隨機森林(Random Forest)和xgboost如何處理缺失
相關文章
相關標籤/搜索