機器學習面試必知:隨機森林

隨機森林,指的是利用多棵樹對樣本進行訓練並預測的一種分類器。隨機森林由多個決策樹構成。決策樹中的每一個節點都是關於某個特徵的條件,爲的是將數據集按照不同的響應變量一分爲二。利用不純度可以確定節點(最優條件),對於分類問題,通常採用基尼不純度(將來自集合中的某種結果隨機應用於集合中某一數據項的預期誤差率)或者信息增益(當前熵與兩個新羣組經加權平均後的熵之間的差值)。 能否將隨機森林中的基分類器由決策
相關文章
相關標籤/搜索