數據挖掘知識點-決策樹

簡介 對於《數據挖掘導論》的學習總結,使用C4.5決策樹。 正文 以C4.5爲基礎,決策樹算法的一般過程如下: 給定一個表示爲「屬性-值」格式的數據集T。數據集由多個具有輸入屬性和一個輸出屬性的實例組成。 選擇一個最能區別T中實例的輸入屬性,C4.5使用增益率來選擇該屬性。 使用該屬性創建一個樹節點,同時創建該節點的分支,每個分支爲該節點的所有可能取值。 使用這些分支,將數據集中的實例進行分類,成
相關文章
相關標籤/搜索