機器學習筆記(6)——C4.5決策樹中的剪枝處理和Python實現

1. 爲什麼要剪枝 還記得決策樹的構造過程嗎?爲了儘可能正確分類訓練樣本,節點的劃分過程會不斷重複直到不能再分,這樣就可能對訓練樣本學習的「太好」了,把訓練樣本的一些特點當做所有數據都具有的一般性質,cong從而導致過擬合。這時就可以通過剪枝處理去掉yi一些分支來降低過擬合的風險。 剪枝的基本策略有「預剪枝」(prepruning)和「後剪枝」(post-pruning): 預剪枝是在決策樹的生成
相關文章
相關標籤/搜索