課程二(Improving Deep Neural Networks: Hyperparameter tuning, Regularization and Optimization),第三週(Hype

 

【中文翻譯】算法

  二、每一個 hyperparameter, 若是設置不佳, 會對訓練產生巨大的負面影響, 因此全部的參數都一樣重要, 能夠很好地調整。真的仍是假的?spa

 【中文翻譯】翻譯

   四、若是你認爲β (hyperparameter 爲動量) 在0.9 和0.99 之間, 如下是推薦的方法爲 beta 的值抽樣?3d

 

【中文翻譯】orm

 八、如下哪一項關於γ和β在Batch Norm 中的陳述是真的?blog

   每一個層都有一個全局值γ∈R 和一個全局值β∈R, 並適用於該層中的全部隱藏單元。  

  最優的值是和β = μ。  變量

  β和γ是算法的參數, 咱們經過隨機抽樣進行調整。方法

  他們能夠使用Adam, 動量梯度降低與,或 RMSprop訓練, 不僅是與梯度降低。im

  它們設置給定層的線性變量 z [l] 的平均值和方差。d3

相關文章
相關標籤/搜索