決策樹—連續值處理

       由於連續屬性的可取值數目再也不有限,所以不能像前面處理離散屬性枚舉離散屬性取值來對結點進行劃分。所以須要連續屬性離散化,經常使用的離散化策略是二分法,這個技術也是C4.5中採用的策略。下面來具體介紹下,如何採用二分法對連續屬性離散化:git 下面舉個具體的例子,來看看究竟是怎樣劃分的。給定數據集以下(數據集來自周志華《機器學習》,我已經把數據集放到github上了,地址爲:西瓜數據集
相關文章
相關標籤/搜索