數據挖掘面試題之隨機森林(RF)

隨機森林   模型收到低偏差和高方差問題的困擾,應該如何解決 低偏差意味着模型的預測值接近實際值。換句話說,該模型有足夠的靈活性,以模仿訓練所有數據的分佈。貌似很好,但是別忘了,一個過於靈活的模型是沒有泛化能力的。這意味着,當這個模型用在對一個未曾見過的數據集進行測試的時候,它會令人很失望。 在這種情況下,我們可以使用bagging算法(如隨機森林),以解決高方差問題。 bagging算法採用bo
相關文章
相關標籤/搜索