機器學習--詳解CART樹剪枝原理和過程

       這一節主要講前面屢次的提到的決策樹問題,前面的決策樹生成算法遞歸的產生決策樹,直到不能繼續分支或者達到要求爲止,這樣的決策樹每每對訓練數據的分類很準確,由於他就是基於訓練數據的熵或者基尼不存度進行分類的,所以對訓練數據的會產生過擬合現象,而對未知的數據則沒有那麼準確。過擬合的本質緣由是決策樹在訓練時追求如何提升訓練數據的準確度,而沒有考慮構件出的決策樹的複雜性,直觀上咱們能想象出當決
相關文章
相關標籤/搜索