《動手學深度學習Pytorch版》Task3-過擬合、欠擬合及其解決方案;梯度消失、梯度爆炸

過擬合、欠擬合 訓練/泛化誤差 訓練誤差(training error)和泛化誤差(generalization error)。通俗來講,前者指模型在訓練數據集上表現出的誤差,後者指模型在任意一個測試數據樣本上表現出的誤差的期望,並常常通過測試數據集上的誤差來近似。 欠擬合 模型無法得到較低的訓練誤差,我們將這一現象稱作欠擬合(underfitting) 過擬合 模型的訓練誤差遠小於它在測試數據集
相關文章
相關標籤/搜索