cs231n筆記-批量歸一化

批量歸一化 Batch Normalization 期望 高斯範圍內保持激活 unit gaussian activations 操作 在每個唯獨獨立計算經驗均值和方差 歸一化 合理縮放 通常在全連接層或者卷積層的後面,非線性操作的前面進行歸一化操作。 問題:tanh層是否真的希望得到高斯輸入? 合理放縮 引入超參數 γ \gamma γ和 β \beta β來對歸一化後的x進行合理放縮 1. 改
相關文章
相關標籤/搜索