【NLP複習】集成學習——Bootstraping、Bagging、Boosting、GBDT、XGBoost

一、Bootstraping、Bagging、Boosting的思想? Bootstraping(自助抽樣法): 從給定訓練集中有放回的均勻抽樣。假設給定的數據集包含d個樣本。 該數據集有放回地抽樣d次,訓練集中沒出現的概率就是d次都未被選中的概率,即(1-1/d)^d。當d趨於無窮大時,這一概率就將趨近於e^(-1)=0.368,所以留在訓練集中的樣本大概佔原來數據集的63.2%。 Baggin
相關文章
相關標籤/搜索