ImageNet Classification with Deep Convolutional Neural Networks(翻譯+總結)

網絡架構 網絡共有8層,五個卷積層和三個全連接層。接下來介紹一下網絡架構的一些特點。 1.ReLU Nonlinearity 標準情況下神經元的輸出一般採用tanh或者sigmoid作爲激活函數,但是就梯度下降的訓練時間而言,這些飽和非線性函數要比非飽和非線性函數f(x) = max(0, x)慢得多,這裏將這種非線性單元稱爲Rectified Linear Units (ReLUs)。帶有ReL
相關文章
相關標籤/搜索