ML in Action Note - Day 2 - Decision Tree

第3章:Decision Tree 決策樹:根據不同特徵建立分支 優點:計算複雜度不高,輸出結果容易理解,對中間值的缺失不敏感,可以處理不相關特徵數據。 缺點:可能會產生overfitting。   P1:劃分數據集,創建決策樹 信息增益:劃分數據集前後信息發生的變化稱爲信息增益。 熵entropy:集合信息的度量方式就稱爲熵。熵定義爲信息的期望值。 如果袋分類的事務可能劃分在多個分類中,則的信息
相關文章
相關標籤/搜索