Bagging和隨機森林

Bagging 基本概念 又稱袋裝(bagging)或者自助聚集(boot strap aggregating) 是一種根據均勻概率分佈從數據集中重複採樣(有放回)的技術。每個自助採樣的樣本集都和原數據集一樣大。 在又放回的抽樣中,如果抽樣的個數和原數據集的大小一致,則自助樣本 Di D i 中會有 63% 63 % 的原訓練數據,因爲每一個樣本抽到 Di D i 的概率爲 1−(1−1N)N 1
相關文章
相關標籤/搜索