機器學習十三大經典算法

一、決策樹 根據一些 特徵(feature )進行分類,每個節點提一個問題,通過判斷,將數據分爲兩類,再繼續提問。 判斷的依據是信息熵增益,計算公式如下: 其中的n代表有n個分類類別(比如假設是2類問題,那麼n=2)。分別計算這2類樣本在總樣本中出現的概率p1和p2,這樣就可以計算出未選中屬性分枝前的信息熵。 模型可以根據已有數據學習得到,再投入新數據的時候,就可以根據這棵樹上的問題,將數據劃分到
相關文章
相關標籤/搜索