決策樹中的連續值處理

連續值處理: 決策樹處理的是離散數據,當離散數據中混雜着連續數據時,咱們但願將連續數據離散化。python 咱們能夠將連續取值的值域劃分爲多個區間,每一個區間視爲一個屬性取值,這樣就將連續數據離散化了。算法 例如:屬性a的取值範圍爲0-100,咱們劃分爲0-25, 25-50, 50-75, 75-100四個區間,做爲屬性a的四種取值app 那麼,劃分邊界的選擇就是咱們須要解決的問題。咱們以二分爲
相關文章
相關標籤/搜索