RandomForest特徵重要度問題

在構建隨機森林的過程當中,每一顆樹所使用的數據不一樣,這使得每一顆樹上的特徵重要性表現的都不一樣。因此要評估每一個特徵在每棵樹上的重要度來做爲特徵選擇的依據。web 隨機森林衡量特徵重要度的方法主要有兩種,分別是Gini係數,和袋外偏差率。svg 不純度的減小(sklearn中使用) 隨機森林的不純度經常使用gini /entropy /information gain測量,以Gini係數爲例:
相關文章
相關標籤/搜索