西瓜書之決策樹的一生

最近看西瓜書的決策樹這一章,給我看懵了。感覺得自己動手一步一步計算才能理解具體怎麼構造的,然後才能寫程序。就以書上的西瓜集2.0爲例: 1.先搞清兩個概念: 信息熵和信息增益 信息熵越小,純度越高。計算公式如下: 條件熵: 信息增益越大,意味着獲得的「純屬提升」越大。因此我們使用信息增益來進行決策樹的劃分屬性選擇。 計算過程如下: 插一句題外話,由上圖可見手機鏡頭會讓原圖發生凹凸變化,所以鏡子裏的
相關文章
相關標籤/搜索