【機器學習】【決策樹】C4.5算法,詳解+python代碼實現

ID3算法只有樹的生成,因此該算法生成的樹容易產生過擬合,C4.5在生成的過程,用信息增益比來選擇特徵。node ID3算法以信息增益做爲劃分訓練數據集的特徵,存在缺點:偏向於選擇特徵值較多的特徵。python C4.5算法使用信息增益比(information gain ratio),能夠對ID3算法這一缺點進行校訂算法 注意:先計算數據集全部特徵的信息增益比的平均值,而後找到信息增益比大於平均
相關文章
相關標籤/搜索