【機器學習-西瓜書】四、決策樹:信息熵;信息增益;增益率;ID3;C4.5

推薦閱讀:純度;信息熵;信息增益 關鍵詞: 純度;信息熵;信息增益;增益率;ID3;C4.5;基尼指數;預剪枝;後剪枝 4.1基本流程 關鍵詞:決策樹(decision tree) 決策樹是一種分類方法,其優點:計算量小,可解釋性強,比較適合處理有缺失屬性值的樣本以及類別不均衡的數據集。缺點:容易過擬合,數值必須是離散型。 一棵決策樹包括:根結點,內部結點和葉結點。整個訓練過程就是從根結點出發,經
相關文章
相關標籤/搜索