機器學習實戰11-訓練深層神經網絡

      如果你需要解決非常複雜的問題,例如檢測高分辨率圖像中的數百種類型的對象, 你可能需要訓練更深的DNN,也許有 10 層,每層包含數百個神經元,通過數十萬個連接來連接。: 首先,你將面臨棘手的梯度消失問題(或相關的梯度爆炸問題),這會影響深度神經網絡,並使較低層難以訓練。 其次,對於如此龐大的網絡,訓練將非常緩慢。 第三,具有數百萬參數的模型將會有嚴重的過擬合訓練集的風險。 一、梯度消失
相關文章
相關標籤/搜索