LightGBM參數及分佈式

Xgboost的缺點 (1)在每一次迭代的時候,都需要遍歷整個訓練數據多次。如果把整個訓練數據裝進內存則會限制訓練數據的大小;如果不裝進內存,反覆地讀寫訓練數據又會消耗非常大的時間。 (2)預排序方法(pre-sorted):首先,空間消耗大。這樣的算法需要保存數據的特徵值,還保存了特徵排序的結果(例如排序後的索引,爲了後續快速的計算分割點),這裏需要消耗訓練數據兩倍的內存。其次,時間上也有較大的
相關文章
相關標籤/搜索