決策樹的預剪枝和後剪枝,連續值與缺失值

預剪枝是指在決策樹生成過程中,對每個結點在劃分前先進行估計,若當前結點的劃分不能帶來決策樹泛化性能提升,則停止劃分並將當前結點標記爲葉子結點。 優點:算法簡單,效率高,適合解決大規模問題 缺點:有欠擬合的風險   後剪枝是先從訓練集生成一顆完整的決策樹,然後自底向上地對非葉子結點進行考察,若將該結點對應的子樹替換爲葉子結點能帶來決策樹泛化性能提升,則將該子樹替換爲葉子結點。 優點:相比於預剪枝,泛
相關文章
相關標籤/搜索