神經網絡訓練的一些建議（方差和偏差的問題：正則化）

時間 2020-12-30

原文原文鏈接

參數和超參數算法中的learning rate a（學習率）、iterations(梯度下降法循環的數量)、L（隱藏層數目）、n（隱藏層單元數目）、choice of activation function（激活函數的選擇）都需要你來設置，這些數字實際上控制了最後的參數W和b的值，所以它們被稱作超參數。實際上深度學習有很多不同的超參數，之後我們也會介紹一些其他的超參數，如momentum、mi