數據挖掘十大算法(一):決策樹分類C4.5算法

一、決策樹分類的思想 如下圖所示,爲一個待訓練的數據集/訓練集,表示一個人具備年齡、收入、是否學生、信譽這4個屬性,待訓練的目標是這個人是否購買計算機。其中年齡、收入、是否學生、信譽被稱作描述屬性,是否購買計算機稱作類別屬性,即分爲什麼類別。 爲了理解什麼叫決策樹,我們直接跳到結果(利用上述數據集,得到的決策樹),決策樹如下圖: 這個決策樹的含義,類似於一個程序判斷框圖,輸入一個人的屬性值4元組:
相關文章
相關標籤/搜索