監督學習(七)——決策樹集成:隨機森林

決策樹經常會對訓練數據進行過擬合,也就是訓練數據精度高,而預測結果很低。隨機森林就是許多決策樹的集合,每一棵決策樹跟其他決策樹都不同,每棵樹都會不同方式的過擬合,那麼對這些樹的結果取平均值,就可以降低過擬合。 隨機森林的隨機方法有兩種: 1、通過選擇用於構造樹的數據點; 2、通過選擇每次劃分測試的特徵。 一、構造隨機森林 構造一個隨機森林模型,需要先確定用於構造的樹的個數 (RandomFores
相關文章
相關標籤/搜索