十大機器學習算法的優缺點及選擇依據

C4.5算法 C4.5算法的核心思想是ID3算法,是ID3算法的改進: 用信息增益率來選擇屬性,克服了用信息增益來選擇屬性時變相選擇取值多的屬性的不足; 在樹的構造過程中進行剪枝; 能處理非離散化數據; 能處理不完整數據。 優點: 產生的分類規則易於理解,準確率高。 缺點: 在構造過程中,需要對數據集進行多次的順序掃描和排序,因而導致算法的低效; C4.5算法只適合於能夠駐留內存的數據集,當訓練集
相關文章
相關標籤/搜索