深入理解Dropout原理

1. 簡介        深度神經網絡包含多個非線性隱藏層,這使得它能夠學習輸入和輸出之間的複雜關係,但我們不可否認的是:在實際情況中,即使測試集和訓練集來自同一分佈,訓練集仍會存在噪聲,那麼網絡就會同時學習數據和噪聲的分佈,這樣就會容易導致過擬合。        在機器學習中,我們通常採用模型組合來提高模型的性能。然而,對於大型的神經網絡來說,對多個網絡模型的輸出取平均的做法是耗費時間和空間的。
相關文章
相關標籤/搜索