C4.5算法詳解(至今見過寫的最好的算法詳解)

C4.5是機器學習算法中的另一個分類決策樹算法,它是基於ID3算法進行改進後的一種重要算法,相比於ID3算法,改進有如下幾個要點: 用信息增益率來選擇屬性。ID3選擇屬性用的是子樹的信息增益,這裏可以用很多方法來定義信息,ID3使用的是熵(entropy, 熵是一種不純度度量準則),也就是熵的變化值,而C4.5用的是信息增益率。 在決策樹構造過程中進行剪枝,因爲某些具有很少元素的結點可能會使構造的
相關文章
相關標籤/搜索