神經網絡訓練的一些建議(方差和偏差的問題:正則化)

參數和超參數 算法中的learning rate a(學習率)、iterations(梯度下降法循環的數量)、L(隱藏層數目)、n(隱藏層單元數目)、choice of activation function(激活函數的選擇)都需要你來設置,這些數字實際上控制了最後的參數W和b的值,所以它們被稱作超參數。 實際上深度學習有很多不同的超參數,之後我們也會介紹一些其他的超參數,如momentum、mi
相關文章
相關標籤/搜索