數據挖掘—決策樹ID3分類算法的C++實現

數據挖掘課上面老師介紹了下決策樹ID3算法,我抽空餘時間把這個算法用C++實現了一遍。 決策樹算法是非常常用的分類算法,是逼近離散目標函數的方法,學習得到的函數以決策樹的形式表示。其基本思路是不斷選取產生信息增益最大的屬性來劃分樣例集和,構造決策樹。信息增益定義爲結點與其子結點的信息熵之差。信息熵是香農提出的,用於描述信息不純度(不穩定性),其計算公式是 Pi爲子集合中不同性(而二元分類即正樣例和
相關文章
相關標籤/搜索