決策樹中連續型值和缺失值處理

連續值處理 上篇介紹了幾種按數據屬性對決策樹劃分的方法,下面考慮一下一些連續型的屬性應該怎樣處理。html 處理連續型屬性(例如西瓜的成熟度、學生成績)時,須要將其離散化,將連續型屬性的值劃分到不一樣的區間(相似於二叉排序樹),比較各個分裂點的Gain值的大小。 在C4.5決策樹算法中,採用二分法處理連續型屬性。 例子: 假設有連續屬性a,D={ a 1 , a 2 , . . . a i . .
相關文章
相關標籤/搜索