0523西瓜書——04決策樹

0523西瓜書——04決策樹 一、樹的劃分流程 二、樹如何進行劃分 1、信息增益 2、增益率 3、基尼指數 三、對抗過擬合的手段——剪枝處理 四、如何處理連續值、缺失值 一、樹的劃分流程 二、樹如何進行劃分 如何選擇最優劃分屬性?我們希望決策樹分支節點所包含的樣本儘可能屬於同一類別,即結點的「純度」越來越高。 1、信息增益 信息增益:結點劃分前後信息熵的差值。 2、增益率 信息增益準則對可取值數目
相關文章
相關標籤/搜索