關於樹模型的缺陷

假如訓練集,驗證集,測試集如下。很明顯數據有時間順序,且y隨着時間線性增長。 假如我們使用gbdt模型,並且使用前6周的數據做訓練,而測試數據是第7周的。 由於樹模型的固有特性,第七週的數據 將會被 分到第六週數據所在的葉子節點。那麼對第七週數據的預測值將約等於第六週的y。 這個預測結果將是不準確的! 而線性模型就不會有這個問題,線性模型能準確地把握住y隨time上升的趨勢。
相關文章
相關標籤/搜索