決策樹、隨機森林與k-means聚類算法

決策樹的構建知足信息熵增益最大化原則 決策樹的優勢:html 可解釋性高 能處理非線性的數據 不須要數據歸一化 能夠用於特徵工程 對數據分佈沒有偏好 普遍使用 容易軟件實現 能夠轉化爲規則 決策樹的弱點算法 啓發式生成,不是最優解 容易過擬合 微小的數據改變會改變整個樹的形狀 對類別不平衡的數據不友好 隨機森林指訓練多個決策樹結果,預測時迴歸取均值,分類取衆數 隨機體如今帶放回的隨機取數據子集作訓
相關文章
相關標籤/搜索