LightGBM參數及分佈式

時間 2021-08-15

原文原文鏈接

Xgboost的缺點（1）在每一次迭代的時候，都需要遍歷整個訓練數據多次。如果把整個訓練數據裝進內存則會限制訓練數據的大小；如果不裝進內存，反覆地讀寫訓練數據又會消耗非常大的時間。（2）預排序方法（pre-sorted）：首先，空間消耗大。這樣的算法需要保存數據的特徵值，還保存了特徵排序的結果（例如排序後的索引，爲了後續快速的計算分割點），這裏需要消耗訓練數據兩倍的內存。其次，時間上也有較大的

>>阅读原文<<