圖像處理中的卷積、池化、反捲積和反池化的理解與思考

卷積的理解

關於卷積在二維離散圖像的可視化理解:
在這裏插入圖片描述
對於卷積過程中各個變量的定義:

  • 輸入圖像的尺寸爲I
  • 圖像外圍的0填充padding爲p
  • 卷積核的尺寸爲k
  • 卷積核移動的步長stride表示爲s
  • 輸出圖像表示爲O

如上圖所示,I = 5,p=1,k=3,s = 1進行卷積提取圖像當中的特徵,計算公式爲:
O = (I − k + 2p )/s + 1

池化的理解

關於池化的可視化理解:
在這裏插入圖片描述
池化的計算公式和方法幾乎和卷積是相同的,池化的作用主要是減小輸出大小和降低過擬合。降低過擬合是減小輸出大小的結果,它同樣也減少了後續層中的參數的數量。

反捲積的理解

可視化理解反捲積:
在這裏插入圖片描述
反捲積的過程,反捲積是卷積的逆過程,又稱作轉置卷積。最大的區別在於反捲積過程是有參數要進行學習的(類似卷積過程),理論是反捲積可以實現UnPooling和unSampling,只要卷積核的參數設置的合理。

反捲積能夠實現神經網絡處理圖像過程中的特徵可視化,根據可視化的結果進行合理的調整網絡架構
反捲積計算公式爲
I = (O - 1) * s + k - 2p

反池化的理解

在這裏插入圖片描述

  • 圖(a)表示UnPooling的過程,特點是在Maxpooling的時候保留最大值的位置信息,之後在unPooling階段使用該信息擴充Feature Map,除最大值位置以外,其餘補0。

  • 與之相對的是圖(b),兩者的區別在於UnSampling階段沒有使用MaxPooling時的位置信息,而是直接將內容複製來擴充Feature Map。從圖中即可看到兩者結果的不同。