決策樹學習

 id3  信息增益html

c4.5  信息增益比算法

CART  基尼指數post

 

參考  url

優缺點:  決策樹算法原理 (上)   決策樹算法原理 (下)htm

簡略介紹:   [Machine Learning & Algorithm] 決策樹與迭代決策樹(GBDT)blog

1.熵的概念get

首先,咱們須要熟悉信息論中熵的概念。熵度量了事物的不肯定性,越不肯定的事物,它的熵就越大。具體的,隨機變量 X 的熵的表達式以下:it

熟悉了一個變量 X 的熵,很容易推廣到多個個變量的聯合熵,這裏給出兩個變量 X 和 Y 的聯合熵表達式:class

有了聯合熵,又能夠獲得條件熵的表達式 H(X|Y),條件熵相似於條件機率, 它度量了咱們的 X 在知道 Y 之後剩下的不肯定性。表達式以下:變量

相關文章
相關標籤/搜索