使用R完成決策樹分類

關於決策樹理論方面的介紹,李航的《統計機器學習》第五章有很好的講解。 傳統的ID3和C4.5一般用於分類問題,其中ID3使用信息增益進行特徵選擇,即遞歸的選擇分類能力最強的特徵對數據進行分割,C4.5唯一不同的是使用信息增益比進行特徵選擇。 特徵A對訓練數據D的信息增益g(D, A) = 集合D的經驗熵H(D) – 特徵A給定情況下D的經驗條件熵H(D|A) 特徵A對訓練數據D的信息增益比r(D,
相關文章
相關標籤/搜索