初級任務三 決策樹算法梳理

信息論基礎(熵 聯合熵 條件熵 信息增益 基尼不純度) 熵:描述一個時間的不確定性 聯合熵:A與B同時發生的信息熵 條件熵:在A發生的情況下B發生的信息熵 信息增益:Gain爲A爲特徵對訓練數據集D的信息增益,它爲集合D的經驗熵H(D)與特徵A給 定條件下D的經驗條件熵H(D|A)之差 基尼不純度:基尼不純度,是指將來自集合中的某種結果隨機應用在集合中,某一數據項的預期誤差率 2.決策樹的不同分類
相關文章
相關標籤/搜索