決策樹與分類算法之C4.5

一、什麼是C4.5算法 C4.5算法是優化的ID3算法(什麼是ID3算法)。優化點在:ID3要求每個分支點的比例相同。但是舉例例子,每個人居住的城市不同,數據中某個城市的人數較多,這就會影響決策樹生成。 解決辦法 把城市上升一個等級,比如省份、華南華北、南方北方 C4.5做法是算信息增益率。 二、舉個列子 這裏算水生動物的信息增利率
相關文章
相關標籤/搜索