Lightgbm如何處理類別特徵?

本篇文章主要參考柯國霖大神在知乎上的回答,以及自己閱讀LGBM的部分源碼整理而來。 1、one-hot編碼弊端 one-hot編碼是處理類別特徵的一個通用方法,然而在樹模型中,這可能並不一定是一個好的方法,尤其當類別特徵中類別個數很多的情況下。主要的問題是: ①可能無法在這個類別特徵上進行切分(即浪費了這個特徵)。使用one-hot編碼的話,意味着在每一個決策節點上只能使用one vs rest(
相關文章
相關標籤/搜索