導言git
這篇文章有2篇論文速遞,都是目標檢測方向,一篇是RefineNet,其是SSD算法、RPN網絡和FPN算法的結合,另外一篇是DES,其是基於SSD網絡進行了改進。注意,兩篇都是CVPR 2018文章。github
CVer算法
編輯: Amusi 網絡
校稿: Amusiide
前戲學習
Amusi 將平常整理的論文都會同步發佈到 daily-paper-computer-vision 上。名字有點露骨,還請見諒。喜歡的童鞋,歡迎star、fork和pull。測試
直接點擊「閱讀全文」便可訪問daily-paper-computer-vision。
link: https://github.com/amusi/daily-paper-computer-vision設計
目標檢測(Object Detection)對象
《Single-Shot Refinement Neural Network for Object Detection》blog
CVPR 2018
Architecture of RefineDet
Detection results on PASCAL VOC dataset
Abstract:對於目標檢測,兩階段方法(例如,更快的R-CNN)已經實現了最高精度,而一階段方法(例如,SSD)具備高效率的優勢。爲了繼承二者的優勢,同時克服它們的缺點,在本文中,咱們提出了一種新的基於single-shot的檢測器,稱爲RefineDet,它比兩階段方法得到更好的精度,並保持一階段方法的檢測效率。 RefineDet由兩個相互鏈接的模塊組成,即 anchor refinement 模塊和目標檢測模塊。具體地,前者旨在(1)過濾掉negative anchor以減小分類器的搜索空間,以及(2)粗略地調整anchor的位置和大小覺得隨後的迴歸器提供更好的初始化。後一模塊將精細anchor做爲前者的輸入,以進一步改進迴歸並預測多類別標籤。同時,咱們設計了一個傳輸鏈接塊來傳輸錨點細化模塊中的特徵,以預測對象檢測模塊中對象的位置,大小和類別標籤。多任務丟失功能使咱們可以以端到端的方式訓練整個網絡。 PASCAL VOC 2007,PASCAL VOC 2012和MS COCO的大量實驗證實,RefineDet能夠高效地實現最早進的檢測精度。
arXiv:https://arxiv.org/abs/1711.06897
github:https://github.com/sfzhang15/RefineDet
注:以後會推出該論文的精讀文章!
《Single-Shot Object Detection with Enriched Semantics》
CVPR 2018
Pipeline for DES
Segmentation branch
Abstract:咱們提出了一種新穎的 single-shot 目標檢測網絡,名爲「Detection with Enriched Semantics」(DES)。咱們的動機是經過語義分割分支和全局激活模塊來豐富典型深度檢測器內目標檢測特徵的語義。分割分支由弱分割ground-truth監督,即,不須要額外的註釋。與此同時,咱們採用全局激活模塊,以自我監督的方式學習通道和對象類之間的關係。PASCAL VOC和MS COCO檢測數據集的綜合實驗結果證實了該方法的有效性。特別是,使用基於VGG16的DES,咱們在VOC2007測試中實現了81.7的mAP,在COCO測試開發上實現了32.8的mAP,在Titan Xp GPU上每一個圖像的推斷速度爲31.5毫秒。 使用較低分辨率的版本,咱們在VOC2007上實現了79.7的mAP,每張圖像的推斷速度爲13.0毫秒。
arXiv:https://arxiv.org/abs/1712.00433
注:以後會推出該論文的精讀文章!