讀論文系列：Object Detection CVPR2016 YOLO

時間 2019-12-06

標籤論文系列 object detection cvpr2016 cvpr yolo 简体版

原文原文鏈接

CVPR2016： You Only Look Once:Unified, Real-Time Object Detectiongit

轉載請註明做者：夢裏茶github

YOLO，You Only Look Once，摒棄了RCNN系列方法中的region proposal步驟，將detection問題轉爲一個迴歸問題網絡

網絡結構

輸出爲每一個格子輸出B個bounding box，每一個bounding box由x,y,w,h表示，爲每一個bounding box輸出一個confidence，即屬於前景的置信度

因而輸出能夠表示爲一個SxSx(B*(4+1)+C)的tensor，訓練只須要根據數據集準備好這樣的tensor進行regression就行學習

前兩行爲定位loss，λ_coord爲定位loss的權重，論文中取5
第三行爲一個bounding box屬於前景時的置信度迴歸loss，
- 當格子中有對象出現時，真實C_i爲1，
- 1_ij^obj是一個條件表達式，當bounding box「負責(is responsible for)」圖中一個真實對象時爲1，不然爲0，
- 所謂「負責」，指的是在當前這個格子的全部bounding box中，這個bounding box與真實的bounding box重疊率最大
第四行爲一個bounding box屬於背景時的置信度迴歸loss，
- 爲了不負樣本過多致使模型跑偏， λ_noobj=0.5，
- 1_ij^noobj是一個條件表達式，爲1_ij^obj取反
- 因而咱們能夠發現一個格子的兩個bounding box的分工：一個貢獻前景loss，一個貢獻背景loss ，不管是前景背景box，咱們都但願它們的confidence接近真實confidence，實際上，若是 λ_noobj=1，第四五行能夠合併爲一項求和，但因爲背景box太多，因此才單獨拆開加了權重約束
第五行爲分類loss，1_i^obj是一個條件表達式，當有對象出如今這個格子中，取1，不然取0