集成學習算法之boosting、bagging和隨機森林算法原理

集成學習的定義 集成學習的主要思路是先通過一定的規則生成多個學習器,再採用某種集成策略進行組合,最後綜合判斷輸出最終結果。一般而言,通常所說的集成學習中的多個學習器都是同質的"弱學習器"。基於該弱學習器,通過樣本集擾動、輸入特徵擾動、輸出表示擾動、算法參數擾動等方式生成多個學習器,進行集成後獲得一個精度較好的"強學習器"。 舉例說明:以三分類問題爲例,假如有 N 個分類器相互獨立,錯誤率都爲 P
相關文章
相關標籤/搜索