ID3決策樹中連續值的處理+周志華《機器學習》圖4.8和圖4.10繪製

轉載自 http://www.javashuo.com/article/p-kgvlevwd-no.html 用一句話總結這篇博客的內容就是: 對於當前n條數據,相鄰求平均值,得到n-1個分割值,要點如下: ①連續數值特徵的熵計算就是對上面的n-1個分割值不停嘗試, 嘗試得到最佳分割值,利用分割值兩側的數據來計算條件熵 進而最終計算最大熵增益. ②如果當前同時存在離散值和連續值特徵,那麼連續值取最
相關文章
相關標籤/搜索