《機器學習:算法原理和編程實踐》3:決策樹的發展

1、決策樹的算法框架 決策樹的主函數 計算最優特徵子函數:ID3用信息增益、C4.5用信息增益率、CART用節點方差的大小等。 信息熵:用來表示任何一種能量在空間中分佈的均勻程度。能量分佈得越均勻,熵就越大。在決策樹中,它不僅能用來度量類別的不確定性,也可以用來度量包含不同特徵的數據樣本與類別的不確定性。 CART算法是目前決策樹算法中最爲成熟的一類算法,應用範圍也比較廣泛。       在迴歸樹
相關文章
相關標籤/搜索