課程二(Improving Deep Neural Networks: Hyperparameter tuning, Regularization and Optimization)，第三週（Hype

時間 2019-11-17

標籤課程 improving deep neural networks hyperparameter tuning regularization optimization 第三 hype 简体版

原文原文鏈接

【中文翻譯】算法

二、每一個 hyperparameter, 若是設置不佳, 會對訓練產生巨大的負面影響, 因此全部的參數都一樣重要, 能夠很好地調整。真的仍是假的？spa

【中文翻譯】翻譯

四、若是你認爲β (hyperparameter 爲動量) 在0.9 和0.99 之間, 如下是推薦的方法爲 beta 的值抽樣？3d

【中文翻譯】orm

八、如下哪一項關於γ和β在Batch Norm 中的陳述是真的？blog

　　每一個層都有一個全局值γ∈R 和一個全局值β∈R, 並適用於該層中的全部隱藏單元。　　

　　最優的值是和β = μ。　　變量

　　β和γ是算法的參數, 咱們經過隨機抽樣進行調整。方法

　　他們能夠使用Adam, 動量梯度降低與,或 RMSprop訓練, 不僅是與梯度降低。im

　　它們設置給定層的線性變量 z ^[l] 的平均值和方差。d3

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。