【機器學習】決策樹(下)——CART算法及剪枝處理

前言:上篇博文已經介紹了ID三、C4.5生成決策樹的算法。因爲上文使用的測試數據以及創建的模型都比較簡單,因此其泛化能力很好。可是,當訓練數據量很大的時候,創建的決策樹模型每每很是複雜,樹的深度很大。此時雖然對訓練數據擬合得很好,可是其泛化能力即預測新數據的能力並不必定很好,也就是出現了過擬合現象。這個時候咱們就須要對決策樹進行剪枝處理以簡化模型。另外,CART算法也可用於創建迴歸樹。本文先承接上
相關文章
相關標籤/搜索