[machine learning] 決策樹ID3算法

決策樹是經常使用的數據挖掘的算法,原理是通過訓練集創造一個樹,然後對待分類的數據進行分類。決策樹只適用於標稱型數據,即離散化的數據。優點是數據的形式很容易理解,可以處理不相關的特徵數據,缺點是無法給出數據的內在含義,並且ID3算法會產生過度匹配的問題。 一。決策樹的一般流程 收集數據———準備數據(必須是標稱型數據,數值型的數據需要離散化)——分析數據——訓練算法(構造樹)—— 測試算法(使用經驗
相關文章
相關標籤/搜索