欠擬合和過擬合&&梯度消失和梯度爆炸&&循環神經網絡進階

一.欠擬合和過擬合 1.1訓練誤差與泛化誤差 在解釋上述現象之前,我們需要區分訓練誤差(training error)和泛化誤差(generalization error)。通俗來講,前者指模型在訓練數據集上表現出的誤差,後者指模型在任意一個測試數據樣本上表現出的誤差的期望,並常常通過測試數據集上的誤差來近似。 1.2 模型選擇 1.2.1 驗證數據集 從嚴格意義上講,測試集只能在所有超參數和模型
相關文章
相關標籤/搜索