吳恩達 神經網絡和深度學習 第三週淺層神經網絡

單個樣本                                                                                                                   多個樣本 激活函數 tanh 比sigmle 好,是因爲數據平均值爲0. 但是數據太大或者太小,在激活函數對應的斜率爲0,梯度下降很難,梯度消失。 relu 是默
相關文章
相關標籤/搜索