機器學習筆記(XIII)決策樹(III)連續與缺失值

連續值處理 對於連續屬性的可取數目再也不有限,所以,不能直接根據連續屬性的可取值來對結點進行劃分。web 連續離散化之二分法 具體作法 對於給定的樣本集 D 和連續屬性 a ,假定 a 在 D 上出現了 n 個不一樣的取值,將這些值從小到大進行排序,記爲 {a1,a2,…,an} 。基於劃分點 t 可將 D 分爲子集 D−t 和 D+t , 若 ai∈D−t 則 ai≤t 若 ai∈D+t 則 a
相關文章
相關標籤/搜索