隨機森林-解決多重共線性降維進行調參

我們在使用python的隨機森林包時,會用到max_feature這個參數 這個參數是我們進行選擇樣本特徵的個數,如果當樣本的特徵較多時,比如有50-100個,我們選擇auto,全部特徵可以進行降維,即有的特徵重要性過低的可以捨去。選擇sqrt可以去除樣本中特徵之間多重共線性的干擾,sqrt代表每次選擇根號n個特徵進行建樹。從而減少樣本間多重共線性的干擾。
相關文章
相關標籤/搜索