決策樹的優化-剪枝

爲什麼決策樹需要剪枝?我們可以類比於神經網絡的「過擬合」問題來進行思考。在神經網絡之中,會出現過擬合問題,即出思安對特定的樣本識別率升高,對其餘樣本的識別率降低。在決策樹中也會出現類似的問題,會出現枝條過多的現象,是問題複雜化,準確率卻得不到上升。 決策樹的剪枝分爲2種,一種是預剪枝,第二種是後剪枝。 預剪枝:在創建進行到某一個節點處,我們先計算當前節點的準確率,然後在按照該節點的屬性進行分類,在
相關文章
相關標籤/搜索