機器學習-剪枝處理

決策樹生成算法遞歸的產生決策樹,直到不能繼續分支或達到要求爲止,這樣的決策樹往往對訓練數據分類很準確,因爲他就是基於訓練數據的熵或者基尼不純度(類似熵,計算更方便)進行分類的,因此對訓練數據會產生過擬合現象,而對未知的數據則沒有那麼準確。過擬合的本質原因是決策樹在訓練時追求如何提高訓練數據準確度,而沒有考慮決策樹的複雜性。 決策樹由節點和有向邊組成,節點有兩種類型:內部節點和葉子節點,內部節點表示
相關文章
相關標籤/搜索