機器學習【1】決策樹中ID3、C4.5、C5.0、CART、CHAID、QUEST算法

C4.5和C5.0的區別: C5.0是C4.5應用於大數據集上的分類算法,主要在執行效率和內存使用方面進行了改進。 CHAID算法 根節點的選取: 每個輸入變量和輸出變量(標籤)做獨立性檢驗,卡方值最大(P值最小)的爲父節點,也就是說,跟輸出變量相關的顯著性最高的變量作爲根節點。 節點的分裂: 一、連續型輸入變量: 1、先將輸入變量進行區間劃分,比如輸入變量爲價格,價格的最小單位是1元,那麼,組距
相關文章
相關標籤/搜索