決策樹系列(四)——C4.5

決策樹系列(四)——C4.5 預備知識:決策樹、ID3       如上一篇文章所述,ID3方法主要有幾個缺點:一是採用信息增益進行數據分裂,準確性不如信息增益率;二是不能對連續數據進行處理,只能通過連續數據離散化進行處理;三是沒有采用剪枝的策略,決策樹的結構可能會過於複雜,可能會出現過擬合的情況。       C4.5在ID3的基礎上對上述三個方面進行了相應的改進:       a)  C4.5
相關文章
相關標籤/搜索