連續與缺失值-----決策樹

連續與缺失值 決策樹給咱們的印象更可能是處理離散屬性,可是在實際的任務中也會遇到連續屬性,或者屬性中有缺失值的狀況,那麼咱們對於這種數據咱們如何進行處理。算法 1. 連續值處理 由於連續屬性的可取值數目再也不有限,所以,不能直接根據連續屬性的可取值來對結點進行劃分,不然,這樣的決策樹毫無泛化能力。因此,咱們將連續屬性進行離散化。最簡單的策略是採用「二分法」,C4.5決策樹算法中也是使用的這種機制。
相關文章
相關標籤/搜索