決策樹1

樹以代表訓練樣本的單個結點開始(步驟1)。 如果樣本都在同一個類,則該結點成爲樹葉,並用該類標號(步驟2 和3)。 否則,算法使用稱爲信息增益的基於熵的度量作爲啓發信息,選擇能夠最好地將樣本分類的屬性(步驟6)。該屬性成爲該結點的「測試」或「判定」屬性(步驟7)。在算法的該版本中, 所有的屬性都是分類的,即離散值。連續屬性必須離散化。 對測試屬性的每個已知的值,創建一個分枝,並據此劃分樣本(步驟8
相關文章
相關標籤/搜索