決策樹學習筆記1

一、衡量標準: 1、熵:隨機變量不確定性的度量 2、信息增益:特徵X使類Y的不確定性減少的程度 舉例計算:有如下數據,4個特徵,1個結果(play) 計算類Y(打不打球)的熵值:0.94; Outlook = sunny 的熵值計算: -2/5*log2(2/5)-3/5*log2(3/5) = 0.971; 3、信息增益率: 二、算法分類: 1、ID3; 2、C4.5;(解決ID3問題,考慮自身
相關文章
相關標籤/搜索