yolov3

思想:yolo主模型輸出三個特徵圖,如(?,13,13,anchor_num*(5+num_classes))、(?,26,26,anchor_num*(5+num_classes))、(?,52,52,anchor_num*(5+num_classes)),以後如尺度爲13的特徵圖 會   變形爲(?,13,13,anchor_num,5+num_classes),最後一維前五個分別爲4個框值xywh和1個框中含有物體的置信度。.net

後面爲各種別機率。 ?爲batch,13*13 爲檢測的尺度,最後會還原成:框座標(?*13*13*3,4),至關於每張圖檢測了13*13*3個框(固然有不少無效的和重複的,以後會篩選),3是對應於一層3個anchor中心值,此值是原框d w聚類來的。blog

一張圖至關於輸出3層特徵圖,第一層至關於檢測了13*13*3個框,第二三層至關於檢測了26*26*3和52*52*3個框,因此說大尺寸檢測的小物體,小尺寸檢測的大物體,而後把三層檢測的框縱向拼接到一塊兒,在進行篩選。io

 

每裏面的最大框數 是指某一類別的框不超過最大框數,全部類別加一塊兒有可能超過最大框數class

anchor:至關於每張圖會生成13*13*3(26和52) 個框,每一個框都去和9個anchor作交叉比iou,選出交叉比比大於閾值的,這樣雖然選的很糙,但以後會有邊界框修正操做。就是至關於先找了幾個固定位置,讓選的框不要偏離這幾個位置太多。以後在對選出的框做偏移修正。test

論文解讀gc

https://blog.csdn.net/yangchengtest/article/details/80664415sse

相關文章
相關標籤/搜索