【中文翻譯】算法
二、每一個 hyperparameter, 若是設置不佳, 會對訓練產生巨大的負面影響, 因此全部的參數都一樣重要, 能夠很好地調整。真的仍是假的?spa
【中文翻譯】翻譯
四、若是你認爲β (hyperparameter 爲動量) 在0.9 和0.99 之間, 如下是推薦的方法爲 beta 的值抽樣?3d
【中文翻譯】orm
八、如下哪一項關於γ和β在Batch Norm 中的陳述是真的?blog
最優的值是和β = μ。 變量
β和γ是算法的參數, 咱們經過隨機抽樣進行調整。方法
他們能夠使用Adam, 動量梯度降低與,或 RMSprop訓練, 不僅是與梯度降低。im
它們設置給定層的線性變量 z [l] 的平均值和方差。d3