決策樹中連續值與缺失值的處理方法

連續值的處理方法 對於連續屬性,不能直接根據連續屬性的可取值對節點進行劃分,可以使用二分法對連續屬性進行劃分。 劃分方法 假設數據集 D D D中的屬性 a a a是連續的,那麼對於 a a a中的結點,每兩個結點取中值作爲候選劃分點,然後就可以像離散屬性值一樣處理這些候選劃分點。 G a i n ( D , a , t ) = E n t ( D ) − ∑ ∣ D t k ∣ ∣ D ∣ E
相關文章
相關標籤/搜索