深度學習：欠擬合問題的幾種解決方案

時間 2020-05-23

標籤深度學習擬合問題幾種解決方案简体版

原文原文鏈接

我最近作深度學習在連續中文語音識別方向的應用的時候，根據一些論文和網上一些公開代碼和模型結構，設計了一個神經網絡的模型。可是在訓練的時候，就首先遇到了很讓人頭疼的欠擬合問題。神經網絡欠擬合的特徵是，訓練了很長時間，可是在訓練集上，loss值仍然很大甚至與初始值沒有太大區別，並且精確度也很低，幾乎接近於0，在測試集上亦如此。且先無論模型結構配置的優劣，就欠擬合問題來講，須要從以下方面來着手。html

>>阅读原文<<