第四章 決策樹

1、基本流程 西瓜問題的決策過程: 根結點包含樣本全集。 葉結點對應決策結果。(類別標記爲樣例中最多的類別) 其他結點對應屬性測試,每個結點包含的樣本集合根據屬性測試的結果被劃分到不同的子結點。 2、劃分選擇 即如何選擇最優劃分屬性,使得決策樹的分支結點所包含的樣本儘可能屬於同一類別。 (1)信息增益 信息熵(information entropy):度量樣本集合純度的指標。 假設樣本集合D中第k
相關文章
相關標籤/搜索