決策分類算法-C4.5算法原理

與ID3的不一樣之處:算法 (1)分支指標採用增益比例,而不是ID3所使用的信息增益;spa (2)按照數值屬性值的大小對樣本排序,從中選擇一個分割點,劃分數值屬性的取值區間,從而將ID3的處理能力擴充到數值屬性上來。blog (3)將訓練樣本集中的位置屬性值用最經常使用的值代替,或者用該屬性全部取值的平均值代替,從而處理缺乏屬性值的訓練樣本。排序 (4)使用k次迭代交叉驗證,評估模型的優劣程度i
相關文章
相關標籤/搜索