AI佳做解讀系列(五) －目標檢測二十年技術綜述

時間 2019-12-14

標籤解讀系列目標檢測 20年技術綜述简体版

原文原文鏈接

計算機視覺中的目標檢測，因其在真實世界的大量應用需求，好比自動駕駛、視頻監控、機器人視覺等，而被研究學者普遍關注。

上週四，arXiv新出一篇目標檢測文獻《Object Detection in 20 Years: A Survey》，其對該領域20年來出現的技術進行了綜述，這是一篇投向PAMI的論文，做者們review了400+篇論文，總結了目標檢測發展的里程碑算法和state-of-the-art，而且難能難得的對算法流程各個技術模塊的演進也進行了說明，還深刻到目標檢測的特定領域，如人臉檢測、行人檢測等進行了總結，最後列舉了將來可能的發展方向。溫故而知新，該論文極具參考價值！

做者來自美國密歇根大學、北京航空航天大學、滴滴出行。下圖是做者在谷歌學術檢索目標檢測相關關鍵字返回的歷年文獻數量，可見該領域20年來愈來愈受到學術界的關注。2018年有將近1200篇相關文獻發表。

目標檢測路線圖

做者將目標檢測近20年來的里程碑算法畫在時間軸上，以下：

可見做者將算法大體分爲2012年以前的傳統檢測方法與2012年以後出現的基於深度學習的檢測方法。傳統方法好比咱們所熟知的V-J檢測、HOG檢測、DPM算法。深度學習方法大相徑庭的分爲兩條技術路徑：單階段檢測算法與兩階段檢測算法。同時做者把目標檢測的一些精度提升的方法的出現也列在了時間軸上，好比bounding box regression、multi-resolution detection等。

在目前最知名的評估數據集VOC 2007 、VOC 20十二、 COCO上不一樣年份出現的算法精度提升，以下圖：

可見，深度學習在檢測領域的開山之做，RCNN取得了大幅度精度提升，開闢了檢測的新時代。而今年新出的TridentNet是目前在COCO數據集上取得較高精度的算法。

目標檢測數據集

做者總結了通用目標檢測及幾個特定目標檢測的數據集。通用目標檢測領域經常使用數據集：

幾個經常使用數據集的示例圖片：

行人檢測經常使用數據集：

人臉檢測經常使用數據集：

文本檢測經常使用數據集：

交通燈檢測與交通標誌檢測經常使用數據集：

遙感目標檢測經常使用數據集：

目標檢測技術演進

做者將目標檢測中涉及的各類技術的演進鋪展開來，讓咱們能就單一技術看到發展路徑。早期目標檢測算法表明：

多尺度檢測技術演進路線：

包圍框迴歸技術演進路線：

目標上下文建模技術演進路線圖：

包圍框非極大抑制（NMS）技術演進路線圖：

難檢測負樣本挖掘技術演進路線圖：

目標檢測計算加速

目標檢測天生是計算密集型任務，因此從其在其發展的各個階段，目標檢測算法的加速就是一個重要議題。做者總結的目標檢測計算加速方法：

可見主要是在三個層次加速：

數值計算層次（如積分圖、矢量量化等）
檢測引擎層次（網絡剪枝與量化、輕量級網絡設計等）
檢測流程層次（特徵圖共享、分類器加速、級連檢測等）

由於目前CNN檢測方法是主流，做者列出的近年出現的卷積計算的一些加速方法及其時間複雜度：

目標檢測進展

做者在這部分描述了近三年來state-of-the-art目標檢測技術的研究進展：

更好地引擎（engine）：做者將深度學習目標檢測網絡的骨幹網稱爲其引擎。改進目標檢測的一個直接思路就是使用更加先進的骨幹網。以下圖（相同算法用相同顏色的圓點表示，使用相同引擎的算法結果用一個大括號鏈接，咱們能夠輕易看出，使用不一樣的引擎對最終精度的影響更大）：
使用更好的特徵：1）特徵融合；2）學習大感覺野的高分辨率特徵
超越滑動窗口：再也不是侷限於候選區域再分類的模式。做者提到兩種新模式：1）子區域搜索 sub-region search。將目標檢測看爲從初始網格到最終ground truth box的路徑規劃過程。2）關鍵點定位。將目標檢測看爲特定語義點定位的過程。好比：ECCV18 Oral | CornerNet目標檢測開啓預測「邊界框」到預測「點對」的新思路Grid R-CNN解讀：商湯目標檢測算法
目標定位改進：1）包圍框提精。2）改進loss函數用於較精肯定位。好比：CVPR 2019 | 曠視提出新型目標檢測損失函數：定位更精準
檢測與分割一塊兒進行：分割能夠幫助目標檢測提升類別識別的精度、得到更好地目標定位、潛入更加豐富的上下文。分割的網絡能夠做爲目標檢測的提取網絡，也能夠做爲多任務學習的損失函數，用以改進目標檢測。52CV曾經報道過一篇文章甚至分割徹底能夠用來替換檢測：目標檢測：Segmentation is All You Need ？
旋轉和尺度變化魯棒的目標檢測：針對旋轉變化魯棒改進方向：1）旋轉不變損失函數；2）旋轉校訂；3）Rotation RoI Pooling。針對尺度變化魯棒的改進：1）尺度自適應訓練；2）尺度自適應檢測。
Training from Scratch：不使用預訓練模型，從頭開始訓練目標檢測網絡。好比：CVPR 2019 | 京東AI研究院提出ScratchDet，增強對小目標的檢測，代碼將開源。
對抗訓練：好比有研究代表，GAN能夠用來改進小目標的檢測。
弱監督的目標檢測：不使用包圍框標註，而僅使用圖像級的目標標註的算法。減小標註成本。擴大訓練集。