機器學習筆記(9)——隨機森林算法(RandomForest,RF)

隨機森林算法 RandomForest 1.概念 隨機森林算法把分類樹組合成隨機森林,即在變量(列)的使用和數據(行)的使用上進行隨機化,生成不少分類樹,再彙總分類樹的結果。隨機森林在運算量沒有顯著提升的前提下提升了預測精度。隨機森林對多元共線性不敏感,結果對缺失數據和非平衡的數據比較穩健,能夠很好地預測多達幾千個解釋變量的做用。 2.優缺點 RF的主要優勢有: 1) 訓練能夠高度並行化,對於大數
相關文章
相關標籤/搜索