做者孫培澤git
轉自知乎,已獲受權轉載,請勿二次轉載github
https://zhuanlan.zhihu.com/p/310058362windows
沿着目標檢測領域中 Dense 和 Dense-to-Sparse 的框架,Sparse R-CNN創建了一種完全的 Sparse 框架, 脫離 anchor box,reference point,Region Proposal Network(RPN)等概念,無需Non-Maximum Suppression(NMS) 後處理, 在標準的 COCO benchmark 上使用 ResNet-50 FPN 單模型在標準 3x training schedule 達到了 44.5 AP 和 22 FPS。微信
論文連接:https://msc.berkeley.edu/research/autonomous-vehicle/sparse_rcnn.pdf網絡
項目連接:https://github.com/PeizeSun/SparseR-CNNapp
01 框架
Motivation編輯器
-
第一大類是從非Deep時代就被普遍應用的dense detector,例如DPM,YOLO,RetinaNet,FCOS。在dense detector中, 大量的object candidates例如sliding-windows,anchor-boxes, reference-points等被提早預設在圖像網格或者特徵圖網格上,而後直接預測這些candidates到gt的scaling/offest和物體類別。 -
第二大類是dense-to-sparse detector,例如,R-CNN家族。這類方法的特色是對一組sparse的candidates預測迴歸和分類,而這組sparse的candidates來自於dense detector。
-
NMS 後處理 -
many-to-one 正負樣本分配 -
prior candidates的設計
data:image/s3,"s3://crabby-images/7a93c/7a93ce132a76f329feb30b999fd4b1b3519cca57" alt=""
02 函數
Sparse R-CNN性能
data:image/s3,"s3://crabby-images/7a93c/7a93ce132a76f329feb30b999fd4b1b3519cca57" alt=""
Sparse R-CNN的兩個顯著特色就是sparse object candidates和sparse feature interaction,既沒有dense的成千上萬的candidates,也沒有dense的global feature interaction。Sparse R-CNN能夠看做是目標檢測框架從dense到dense-to-sparse到sparse的一個方向拓展。
03
Architecture Design
Sparse R-CNN的網絡設計原型是R-CNN家族。
Backbone是基於ResNet的FPN。
Head是一組iterative的Dynamic Instance Interactive Head,上一個head的output features和output boxes做爲下一個head的proposal features和proposal boxes。Proposal features在與RoI features交互以前作self-attention。
訓練的損失函數是基於optimal bipartite matching的set prediction loss。
04
Performance
05
Conclusion
data:image/s3,"s3://crabby-images/7a93c/7a93ce132a76f329feb30b999fd4b1b3519cca57" alt=""
備註:目標檢測
data:image/s3,"s3://crabby-images/7a93c/7a93ce132a76f329feb30b999fd4b1b3519cca57" alt=""
目標檢測交流羣
2D、3D目標檢測等最新資訊,若已爲CV君其餘帳號好友請直接私信。
微信號:aicvml
QQ羣:805388940
微博知乎:@我愛計算機視覺
投稿:amos@52cv.net
網站:www.52cv.net
data:image/s3,"s3://crabby-images/7a93c/7a93ce132a76f329feb30b999fd4b1b3519cca57" alt=""
點點【在看】分享技術成果
data:image/s3,"s3://crabby-images/7a93c/7a93ce132a76f329feb30b999fd4b1b3519cca57" alt=""
本文分享自微信公衆號 - 我愛計算機視覺(aicvml)。
若有侵權,請聯繫 support@oschina.cn 刪除。
本文參與「OSC源創計劃」,歡迎正在閱讀的你也加入,一塊兒分享。