決策樹(decision tree)——連續值處理

轉載至決策樹(decision tree)(三)——連續值處理 | 連續值處理     因爲連續屬性的可取值數目不再有限,因此不能像前面處理離散屬性枚舉離散屬性取值來對結點進行劃分。因此需要連續屬性離散化,常用的離散化策略是二分法,這個技術也是C4.5中採用的策略。下面來具體介紹下,如何採用二分法對連續屬性離散化:      下面舉個具體的例子,來看看到底是怎樣劃分的。給定數據集如下(數據集來自周
相關文章
相關標籤/搜索