深度學習:欠擬合問題的幾種解決方案

我最近作深度學習在連續中文語音識別方向的應用的時候,根據一些論文和網上一些公開代碼和模型結構,設計了一個神經網絡的模型。可是在訓練的時候,就首先遇到了很讓人頭疼的欠擬合問題。神經網絡欠擬合的特徵是,訓練了很長時間,可是在訓練集上,loss值仍然很大甚至與初始值沒有太大區別,並且精確度也很低,幾乎接近於0,在測試集上亦如此。且先無論模型結構配置的優劣,就欠擬合問題來講,須要從以下方面來着手。html
相關文章
相關標籤/搜索