Python3機器學習實踐:集成學習之隨機森林

隨機森林步驟: 構建多個數據集 在包括N個樣本的數據集中,採用有放回的抽樣方式選擇N個樣本,構成中間數據集,然後在這個中間數據集的所有特徵中隨機選擇幾個特徵,作爲最終的數據集。以上述方式構建多個數據集;一般迴歸問題選用全部特徵,分類問題選擇全部特徵個數的平方根個特徵 爲每個數據集建立完全分裂的決策樹 利用CART爲每個數據集建立一個完全分裂、沒有經過剪枝的決策樹,最終得到多棵CART決策樹; 預測
相關文章
相關標籤/搜索