動手學深度學習(三)

過擬合、欠擬合及其解決方案; 標題梯度消失、梯度爆炸; 標題循環神經網絡進階 一、過擬合欠擬合及其解決方案 1.模型選擇、過擬合和欠擬合 訓練誤差和測試誤差 在解釋上述現象之前,我們需要區分訓練誤差(training error)和泛化誤差(generalization error)。通俗來講,前者指模型在訓練數據集上表現出的誤差,後者指模型在任意一個測試數據樣本上表現出的誤差的期望,並常常通過測
相關文章
相關標籤/搜索