我的學習CNN的一些筆記,比較基礎,整合了其餘博客的內容html
feature map的理解
在cnn的每一個卷積層,數據都是以三維形式存在的。你能夠把它當作許多個二維圖片疊在一塊兒(像豆腐皮豎直的貼成豆腐塊同樣),其中每個稱爲一個feature map。網絡
feature map 是怎麼生成的?
輸入層:在輸入層,若是是灰度圖片,那就只有一個feature map;若是是彩色圖片(RGB),通常就是3個feature map(紅綠藍)學習
[ 下圖中三大部分依次是輸入RGB圖片,卷積核(也稱過濾器),卷積結果(輸出),* 表明卷積操做,最左部分三片表明3個feature map; spa
若是是灰色圖片(二維),則最左只有一片表明一個feature map,對應的卷積核(過濾器也是二維)].net
其它層:層與層之間會有若干個卷積核(kernel)(也稱爲過濾器),htm
上一層每一個feature map跟每一個卷積核作卷積,都會產生下一層的一個feature map,有N個卷積核,下層就會產生N個feather map。blog
多個feather map的做用是什麼?圖片
在卷積神經網絡中,咱們但願用一個網絡模擬視覺通路的特性,分層的概念是自底向上構造簡單到複雜的神經元。樓主關心的是同一層,那就說說同一層。
咱們但願構造一組基,這組基可以造成對於一個事物完備的描述,例如描述一我的時咱們經過描述身高/體重/相貌等,在卷積網中也是如此。在同一層,咱們但願獲得對於一張圖片多種角度的描述,具體來說就是用多種不一樣的卷積覈對圖像進行卷,獲得不一樣核(這裏的核能夠理解爲描述)上的響應,做爲圖像的特徵。他們的聯繫在於造成圖像在同一層次不一樣基上的描述。get
下層的核主要是一些簡單的邊緣檢測器(也能夠理解爲生理學上的simple cell)。博客
上層的核主要是一些簡單核的疊加(或者用其餘詞更貼切),能夠理解爲complex cell。
多少個Feature Map?真的很差說,簡單問題少,複雜問題多,可是自底向上通常是核的數量在逐漸變多(固然也有例外,如Alexnet),主要靠經驗。
卷積核的理解
不懂的能夠參考下面的博客
https://blog.csdn.net/cheneykl/article/details/79740810
卷積核(過濾器)個數的理解
個人前一篇博客中有寫相關內容http://www.javashuo.com/article/p-smzsxmps-bc.html
第L-1層:輸入圖形通道數=輸入圖像的層數=過濾器層數(三維座標空間上是y方向)
L層:輸出圖像通道數=過濾器個數=第L+1層輸入圖像層數...(無論輸入和過濾層多少層,圖像輸入與每一個過濾器卷積事後都是一層矩陣,影響輸出層數的只有過濾器的個數)
以下圖紅線所示:該層卷積核的個數,有多少個卷積核,通過卷積就會產生多少個feature map,也就是下圖中 `豆腐皮兒`的層數、同時也是下圖`豆腐塊`的深度(寬度)!!
這個寬度能夠手動指定,通常網絡越深的地方這個值越大,由於隨着網絡的加深,feature map的長寬尺寸縮小,本卷積層的每一個map提取的特徵越具備表明性(精華部分),因此後一層卷積層須要增長feature map的數量,才能更充分的提取出前一層的特徵,通常是成倍增長(不過具體論文會根據實驗狀況具體設置)!
參考博文:https://blog.csdn.net/csw19970124/article/details/83376842