隨機深林-特徵重要性計算方式

特徵重要性 一個數據集中往往有成百上前個特徵,如何在其中選擇比結果影響最大的那幾個特徵。 這裏我們要介紹的是用隨機森林來對進行特徵篩選。 用隨機森林進行特徵重要性評估的思想其實很簡單,說白了就是看看每個特徵在隨機森林中的每顆樹上做了多大的貢獻,然後取個平均值,最後比一比特徵之間的貢獻大小。 好了,那麼這個貢獻是怎麼一個說法呢? 通常可以用基尼指數(Gini index)或者袋外數據(OOB)錯誤率
相關文章
相關標籤/搜索