決策樹ID3

ID3算法:傾向於選擇分支多的選項作結點 首先是離散型的數據,按公式求增益,選最大的那個選項作爲分裂結點 關於求Infor_A(D)式子的解釋,第一個5/14是youth,後面的2/5是yes,3/5是no 然後是連續型的數據 左邊有七個年齡,右邊是六個鄰值均值,然後六個均值各切一刀計增益,選最高增益的即可 補充: PS:樣本有缺失項的情況未深入研究
相關文章
相關標籤/搜索