常見算法(logistic迴歸,隨機森林,GBDT和xgboost)

3.隨機森林 隨機森林是一個包含多個決策樹的分類器,構建過程如下: 1)決策樹相當於一個大師,通過自己在數據集中學到的知識對於新的數據進行分類。但是俗話說得好,一個諸葛亮,玩不過三個臭皮匠。隨機森林就是希望構建多個臭皮匠,希望最終的分類效果能夠超過單個大師的一種算法。 2)那隨機森林具體如何構建呢?有兩個方面:數據的隨機性選取,以及待選特徵的隨機選取。 數據的隨機選取: 第一,從原始的數據集中採取
相關文章
相關標籤/搜索