R語言分類算法之隨機森林(Random Forest)

1.原理分析: 隨機森林是經過自助法(boot-strap)重採樣技術,從原始訓練樣本集N中有放回地重複隨機抽取k個樣本生成新的訓練集樣本集合,而後根據自助樣本集生成k個決策樹組成的隨機森林,新數據的分類結果按照決策樹投票多少造成的分數而定. 通俗的理解爲由許多棵決策樹組成的森林,而每一個樣本須要通過每棵樹進行預測,而後根據全部決策樹的預測結果最後來肯定整個隨機森林的預測結果.隨機森林中的每一顆決
相關文章
相關標籤/搜索