spark 隨機森林算法案例實戰

隨機森林算法 由多個決策樹構成的森林,算法分類結果由這些決策樹投票得到,決策樹在生成的過程當中分別在行方向和列方向上添加隨機過程,行方向上構建決策樹時採用放回抽樣(bootstraping)得到訓練數據,列方向上採用無放回隨機抽樣得到特徵子集,並據此得到其最優切分點,這便是隨機森林算法的基本原理。圖 3 給出了隨機森林算法分類原理,從圖中可以看到,隨機森林是一個組合模型,內部仍然是基於決策樹,同單
相關文章
相關標籤/搜索