Task4 模型訓練與驗證

過擬合與欠擬合 過擬合:典型的表現爲訓練集損失遠遠小於驗證集損失。 欠擬合:則表現爲訓練集損失大於驗證集損失。 調參 1.dropout 一般適合於全連接層部分,而卷積層由於其參數並不是很多,所以不需要dropout,加上的話對模型的泛化能力並沒有太大的影響。我們一般在網絡的最開始和結束的時候使用全連接層,而hidden layers則是網絡中的卷積層。所以一般情況,在全連接層部分,採用較大概率的
相關文章
相關標籤/搜索