前戲git
前幾天更了一篇超全的Anchor文章:目標檢測最新方向:推翻固有設置,再也不一成不變Anchor,但其中並無包含本文分享的論文。github
【導讀】今天分享一篇伊利諾伊大學香檳分校和微軟研究院(Microsoft Research)前段時間出的論文。算法
正文網絡
《Anchor Box Optimization for Object Detection》框架
arXiv: https://arxiv.org/abs/1812.00469ide
github:None學習
做者團隊:伊利諾伊大學香檳分校和微軟研究院優化
時間:2018年12月02日設計
方向:目標檢測orm
Abstract:在本文中,咱們提出了一種用於優化目標檢測的 anchor boxes的通用方法。現在,anchor boxes(錨框) 在最早進的檢測框架中被普遍採用。可是,全部這些框架都以啓發式方式預約義 anchor boxes形狀,並在訓練期間 fix 大小。爲了提升準確性並減小設計 anchor boxes的工做量,咱們建議動態學習形狀,使 anchors 可以自動適應數據分佈和網絡學習能力。學習方法能夠經過隨機梯度降低方式輕鬆實現,並插入任何基於 anchor boxes 的檢測框架。額外的訓練成本幾乎能夠忽略不計,而且對推理時間成本沒有影響。詳盡的實驗還代表,在包括Pascal VOC 07 + 12,MS COCO和Brainwash在內的幾個基準數據集上,所提出的 anchor 優化方法在 baseline 方法上始終如一地實現了顯著的改進(≥1%mAP絕對 gain)。同時,還針對不一樣的 anchor boxes 初始化方法驗證了魯棒性,極大地簡化了 anchor boxes 設計的問題。
本文算法
經過結合 localization loss和 classification loss,咱們能夠將優化問題寫成:
所提出的網絡結構
An illustration of the anchor optimization process
創新點
Online Clustering Warm-Up
Soft Assignment Warm-Up
Batch Normalization without Shifting
實驗結果
本文在 Pascal VOC 07 + 12 和 MS-COCO Challenge 2017,以及 Brainwash 的頭部檢測數據集上進行實驗,驗證提出的 anchor 優化方法的有效性。
PASCAL VOC
MS COCO
Brainwash
結論:本文的工做解決了優化 ahchor 形狀的問題,而不是 anchor 的數量,這將是一個有趣的研究課題。最後,關於 anchor 機制爲什麼以及如何比簡單迴歸更好地工做的理論研究對於該領域也是很是有價值的。
想要了解最新最快最好的論文速遞、開源項目和乾貨資料,歡迎加入CVer學術交流羣。涉及圖像分類、目標檢測、圖像分割、人臉檢測&識別、目標跟蹤、GANs、學術競賽交流、Re-ID、風格遷移、醫學影像分析、姿態估計、OCR、SLAM、場景文字檢測&識別和超分辨率等方向。