解決決策樹的過擬合

1. 避免過擬合問題 表1描述的算法增長樹的每一個分支的深度,直到恰好能對訓練樣例完美地分類。然而這個策略並非總是行得通的,事實上,當數據中有噪聲,或訓練樣例的數量太少以至於不能產生目標函數的有代表性的採樣時,這個策略便會遇到困難。在以上任一種情況發生時,這個簡單的算法產生的樹會過度擬合訓練樣例。 表1 專用於學習布爾函數的ID3算法概要 ID3是一種自頂向下增長樹的貪婪算法,在每個結點選取能最好
相關文章
相關標籤/搜索