C4.5算法

C4.5算法 ID3算法的侷限性: 針對屬性取值個數不一樣(通常個數懸差很大),比如,銀行分析客戶透支因素:性別,職業,居住城市,由於三個屬性取值個數差異較大,該情況下就不適合ID3算法。 ID3算法侷限性原因: 針對同樣重要,區分力相同的兩個條件屬性,但是如果一個屬性取值總數比較多,很可能對應的信息增益較大,存在誤導用戶選擇屬性的可能。 ID3算法侷限性的處理手段: 壓縮屬性,劃分區間(比如居住
相關文章
相關標籤/搜索