數據挖掘--決策樹C4.5算法(例題)

C4.5算法與ID3算法的不一樣點: (1)分支指標採用增益比例 (2)數值屬性的處理 (3)處理缺乏屬性值的訓練樣本 (4)使用K次迭代交叉驗證,評估模型的優劣程度; (5)根據生成的決策樹,能夠產生一個if-then規則的集合。web 計算的步驟: 1.對數據源進行預處理 2.計算每一個屬性的信息增益和信息增益率 3.根節點屬性每個可能的取值對應一個子集,對樣本子集遞歸地執行以上Step2過
相關文章
相關標籤/搜索