unet網絡講解,附代碼

轉:html

http://www.cnblogs.com/gujianhan/p/6030639.html數組

key1:網絡

FCN對圖像進行像素級的分類,從而解決了語義級別的圖像分割(semantic segmentation)問題。與經典的CNN在卷積層以後使用全鏈接層獲得固定長度的特徵向量進行分類(全聯接層+softmax輸出)不一樣,FCN能夠接受任意尺寸的輸入圖像,採用反捲積層對最後一個卷積層的feature map進行上採樣, 使它恢復到輸入圖像相同的尺寸,從而能夠對每一個像素都產生了一個預測, 同時保留了原始輸入圖像中的空間信息, 最後在上採樣的特徵圖上進行逐像素分類。最後逐個像素計算softmax分類的損失, 至關於每個像素對應一個訓練樣本。函數

key2:性能

CNN的強大之處在於它的多層結構能自動學習特徵,而且能夠學習到多個層次的特徵:較淺的卷積層感知域較小,學習到一些局部區域的特徵;較深的卷積層具備較大的感知域,可以學習到更加抽象一些的特徵。這些抽象特徵對物體的大小、位置和方向等敏感性更低,從而有助於識別性能的提升。這些抽象的特徵對分類頗有幫助,能夠很好地判斷出一幅圖像中包含什麼類別的物體,可是由於丟失了一些物體的細節,不能很好地給出物體的具體輪廓、指出每一個像素具體屬於哪一個物體,所以作到精確的分割就頗有難度。學習

key3:spa

全鏈接層和卷積層之間惟一的不一樣就是卷積層中的神經元只與輸入數據中的一個局部區域鏈接,而且在卷積列中的神經元共享參數。然而在兩類層中,神經元都是計算點積,因此它們的函數形式是同樣的。所以,將此二者相互轉化是可能的:.net

  • 對於任一個卷積層,都存在一個能實現和它同樣的前向傳播函數的全鏈接層。權重矩陣是一個巨大的矩陣,除了某些特定塊,其他部分都是零。而在其中大部分塊中,元素都是相等的。htm

  • 相反,任何全鏈接層均可以被轉化爲卷積層。好比,一個 K=4096 的全鏈接層,輸入數據體的尺寸是 77512,這個全鏈接層能夠被等效地看作一個 F=7,P=0,S=1,K=4096 的卷積層。換句話說,就是將濾波器的尺寸設置爲和輸入數據體的尺寸一致了。由於只有一個單獨的深度列覆蓋並滑過輸入數據體,因此輸出將變成 114096,這個結果就和使用初始的那個全鏈接層同樣了blog

key4:

通過屢次卷積和pooling之後,獲得的圖像愈來愈小,分辨率愈來愈低。其中圖像到 H/32W/32 的時候圖片是最小的一層時,所產生圖叫作heatmap熱圖,熱圖就是咱們最重要的高維特診圖,獲得高維特徵的heatmap以後就是最重要的一步也是最後的一步對原圖像進行upsampling,把圖像進行放大、放大、放大,到原圖像的大小。最後的輸出是1000張heatmap通過upsampling變爲原圖大小的圖片,爲了對每一個像素進行分類預測label成最後已經進行語義分割的圖像,最後經過逐個像素地求其在1000張圖像該像素位置的最大數值描述(機率)做爲該像素的分類。所以產生了一張已經分類好的圖片。

key5:

把原來CNN操做中的全鏈接變成卷積操做conv六、conv7,圖像的featureMap數量改變可是圖像大小依然爲原圖的1/32,此時圖像再也不叫featureMap而是叫heatMap。

key6:

如今咱們有1/32尺寸的heatMap,1/16尺寸的featureMap和1/8尺寸的featureMap,1/32尺寸的heatMap進行upsampling操做以後,由於這樣的操做還原的圖片僅僅是conv5中的卷積核中的特徵,限於精度問題不可以很好地還原圖像當中的特徵,所以在這裏向前迭代。把conv4中的卷積覈對上一次upsampling以後的圖進行反捲積補充細節(至關於一個差值過程),最後把conv3中的卷積覈對剛纔upsampling以後的圖像進行再次反捲積補充細節,最後就完成了整個圖像的還原。

 

questions:

舉個栗子:若是咱們想讓224×224尺寸的浮窗,以步長爲32在384×384的圖片上滑動,把每一個經停的位置都帶入卷積網絡,最後獲得6×6個位置的類別得分。上述的把全鏈接層轉換成卷積層的作法會更簡便。若是224×224的輸入圖片通過卷積層和下采樣層以後獲得了[7x7x512]的數組,那麼,384×384的大圖片直接通過一樣的卷積層和下采樣層以後會獲得[12x12x512]的數組。而後再通過上面由3個全鏈接層轉化獲得的3個卷積層,最終獲得[6x6x1000]的輸出((12 – 7)/1 + 1 = 6)。這個結果正是浮窗在原圖經停的6×6個位置的得分!

代碼:

http://blog.csdn.net/u012931582/article/details/70215756

 

 

計算機視覺中幾種上採樣方法

http://blog.csdn.net/u014451076/article/details/79156967

https://www.zhihu.com/question/43609045?sort=created

http://blog.csdn.net/zsz_shsf/article/details/53201669 託普利茲矩陣

相關文章
相關標籤/搜索