決策樹算法(機器學習實戰,閱讀筆記)

優點:計算複雜度不高,輸出結果易於理解,對中間值的缺失不敏感,可以處理不相關特徵數據 缺點:可能會產生過度匹配問題 使用數據類型:數值型,標稱型 適用場景:郵件分類,專家系統 原理:在構造決策樹時,需要解決的第一個問題上,當前數據集在哪個特徵在劃分數據分類時起決定性作用,爲了找到決定性的特徵,劃分出最好的結果,我們必須評估每個特徵。完成測試之後,原始數據酒杯劃分爲幾個數據子集,這些數據子集會分佈在
相關文章
相關標籤/搜索