XGBoost缺失值引起的問題及其深度分析

1. 背景 XGBoost模型做爲機器學習中的一大「殺器」,被普遍應用於數據科學競賽和工業領域,XGBoost官方也提供了可運行於各類平臺和環境的對應代碼,如適用於Spark分佈式訓練的XGBoost on Spark。然而,在XGBoost on Spark的官方實現中,卻存在一個因XGBoost缺失值和Spark稀疏表示機制而帶來的不穩定問題。java 事情起源於美團內部某機器學習平臺使用方同
相關文章
相關標籤/搜索