決策樹、邏輯迴歸、線性迴歸使用時注意事項以及模型過擬合策略

決策樹缺點和注意事項:web 決策樹的最大缺點是原理中的貪心算法。所以它所作的選擇只能是某種意義上的局部最優選擇。 若目標變量是連續變量,那麼決策樹就不使用了,改用迴歸模型 若某些自變量的類別種類較多,或者自變量是區間型時,決策樹過擬合的危險會增大。這種狀況須要分箱或屢次模型驗證,確保其具備穩定性。 對區間型變量進行分箱操做時,不管是否考慮了順序因素,都有可能由於分箱喪失了某些重要信息,尤爲是當分
相關文章
相關標籤/搜索