決策樹中基尼不純度初步理解

基尼不純度:從一個數據集中隨機選取子項,度量其被錯誤的劃分到其餘組裏的機率。(書上解釋)python         一個隨機事件變成它的對立事件的機率(簡單理解)spa 計算公式:(fi爲某機率事件發生的機率)3d 下圖是相關曲線圖,能夠參考數據挖掘導論的98頁: code 從上圖能夠看出,基尼係數和熵之半的曲線很是接近,僅僅在45度角附近偏差稍大。所以,基尼係數能夠作爲熵模型的一個近似替代。x
相關文章
相關標籤/搜索