Spark GBDT vs Random Forests vs xgboost

參考spark API文檔 算法層面比較: GBDT vs Random Forests (RF) 1) GBDT一次只訓練一棵樹,而RF一次可以並行地訓練多棵樹,所以GBDT的訓練時間更長。所以,GBDT通常會使用更小的樹,同時也減少訓練一棵樹的時間。 2)RF更不容易過擬合,訓練更多的樹能夠降低RF過擬合的可能性,卻增加GBDT過擬合的可能性。 (因爲在統計學角度,RF通過訓練更多的樹降低方差
相關文章
相關標籤/搜索