deep learning 編程作業總結4----調節神經網絡之初始化,正則化,梯度校驗

一、初始化參數 神經網絡中一個小單元的運算可由 z=wx+b,和 a=g(z)這兩個式子來概括,在剛開始的時候需要對參數w和b賦初始值,如果賦值爲0那麼是沒有意義的,如果賦值爲一個簡單隨機數,那麼會產生梯度爆炸和梯度消失。因此應採用抑梯度異常初始化,關鍵代碼如下所示:parameters['W' + str(l)] = np.random.randn(layers_dims[l], layers_
相關文章
相關標籤/搜索