詳解深度學習之經典網絡架構——LeNet

時間 2019-11-06

標籤詳解深度學習經典網絡架構 lenet 欄目系統網絡简体版

原文原文鏈接

1、基本簡介

LeNet-5出自論文Gradient-Based Learning Applied to Document Recognition，是一種用於手寫體字符識別的很是高效的卷積神經網絡。網絡

2、LeNet網絡的基本結構

LeNet5 這個網絡雖然很小，可是它包含了深度學習的基本模塊：卷積層，池化層，全連接層。是其餘深度學習模型的基礎，這裏咱們對LeNet5進行深刻分析。同時，經過實例分析，加深對與卷積層和池化層的理解。架構

LeNet-5共有7層，不包含輸入，每層都包含可訓練參數；每一個層有多個Feature Map，每一個FeatureMap經過一種卷積濾波器提取輸入的一種特徵，而後每一個FeatureMap有多個神經元。函數

各層參數詳解：學習

一、INPUT層-輸入層編碼

首先是數據 INPUT 層，輸入圖像的尺寸統一歸一化爲32*32。spa

注意：本層不算LeNet-5的網絡結構，傳統上，不將輸入層視爲網絡層次結構之一。3d

二、C1層-卷積層blog

輸入圖片：32*32圖片

卷積核大小：5*5rem

卷積核種類：6

輸出featuremap大小：28*28 （32-5+1）=28

神經元數量：28*28*6

可訓練參數：（5*5+1) * 6（每一個濾波器5*5=25個unit參數和一個bias參數，一共6個濾波器）

鏈接數：（5*5+1）*6*28*28=122304

詳細說明：對輸入圖像進行第一次卷積運算（使用 6 個大小爲 5*5 的卷積核），獲得6個C1特徵圖（6個大小爲28*28的 feature maps, 32-5+1=28）。咱們再來看看須要多少個參數，卷積核的大小爲5*5，總共就有6*（5*5+1）=156個參數，其中+1是表示一個核有一個bias。對於卷積層C1，C1內的每一個像素都與輸入圖像中的5*5個像素和1個bias有鏈接，因此總共有156*28*28=122304個鏈接（connection）。有122304個鏈接，可是咱們只須要學習156個參數，主要是經過權值共享實現的。

三、S2層-池化層（下采樣層）

輸入：28*28

採樣區域：2*2

採樣方式：4個輸入相加，乘以一個可訓練參數，再加上一個可訓練偏置。結果經過sigmoid

採樣種類：6

輸出featureMap大小：14*14（28/2）

神經元數量：14*14*6

可訓練參數：2*6（和的權+偏置）

鏈接數：（2*2+1）*6*14*14

S2中每一個特徵圖的大小是C1中特徵圖大小的1/4。

詳細說明：第一次卷積以後緊接着就是池化運算，使用 2*2核進行池化，因而獲得了S2，6個14*14的特徵圖（28/2=14）。S2這個pooling層是對C1中的2*2區域內的像素求和乘以一個權值係數再加上一個偏置，而後將這個結果再作一次映射。因而每一個池化核有兩個訓練參數，因此共有2x6=12個訓練參數，可是有5x14x14x6=5880個鏈接。

四、C3層-卷積層

輸入：S2中全部6個或者幾個特徵map組合

卷積核大小：5*5

卷積核種類：16

輸出featureMap大小：10*10 (14-5+1)=10

C3中的每一個特徵map是鏈接到S2中的全部6個或者幾個特徵map的，表示本層的特徵map是上一層提取到的特徵map的不一樣組合

存在的一個方式是：C3的前6個特徵圖以S2中3個相鄰的特徵圖子集爲輸入。接下來6個特徵圖以S2中4個相鄰特徵圖子集爲輸入。而後的3個以不相鄰的4個特徵圖子集爲輸入。最後一個將S2中全部特徵圖爲輸入。

則可訓練參數爲：6*(3*5*5+1)+6*(4*5*5+1)+3*(4*5*5+1)+1*(6*5*5+1)=1516

鏈接數：10*10*1516=151600

詳細說明：第一次池化以後是第二次卷積，第二次卷積的輸出是C3，16個10x10的特徵圖，卷積核大小是 5*5. 咱們知道S2 有6個 14*14 的特徵圖，怎麼從6 個特徵圖獲得 16個特徵圖了？這裏是經過對S2 的特徵圖特殊組合計算獲得的16個特徵圖。具體以下：

C3的前6個feature map（對應上圖第一個紅框的6列）與S2層相連的3個feature map相鏈接（上圖第一個紅框），後面6個feature map與S2層相連的4個feature map相鏈接（上圖第二個紅框），後面3個feature map與S2層部分不相連的4個feature map相鏈接，最後一個與S2層的全部feature map相連。卷積核大小依然爲5*5，因此總共有6*(3*5*5+1)+6*(4*5*5+1)+3*(4*5*5+1)+1*(6*5*5+1)=1516個參數。而圖像大小爲10*10，因此共有151600個鏈接。

C3與S2中前3個圖相連的卷積結構以下圖所示：

上圖對應的參數爲 3*5*5+1，一共進行6次卷積獲得6個特徵圖，因此有6*（3*5*5+1）參數。爲何採用上述這樣的組合了？論文中說有兩個緣由：1）減小參數，2）這種不對稱的組合鏈接的方式有利於提取多種組合特徵。

五、S4層-池化層（下采樣層）

輸入：10*10

採樣區域：2*2

採樣方式：4個輸入相加，乘以一個可訓練參數，再加上一個可訓練偏置。結果經過sigmoid

採樣種類：16

輸出featureMap大小：5*5（10/2）

神經元數量：5*5*16=400

可訓練參數：2*16=32（和的權+偏置）

鏈接數：16*（2*2+1）*5*5=2000

S4中每一個特徵圖的大小是C3中特徵圖大小的1/4