數據挖掘算法02 - C4.5

C4.5 決策樹學習通常包括三個步驟 特徵選擇。選取最優特徵來劃分特徵空間,用信息增益或者信息增益比來選擇 決策樹的生成。ID3、C4.5、CART 剪枝 什麼是信息熵? 隨機變量 x 概率 P(x) 表示 x 出現的概率 信息量 H(x)=−log(P(x)) 信息量是信息論中的一個度量,簡單來說就是,當我們觀察到某個隨機變量的具體值時,接收到了多少信息。 而我們接收到的信息量跟發生事件的概率有
相關文章
相關標籤/搜索