論文閱讀：Deformable ConvNets v2

時間 2019-12-14

標籤論文閱讀 deformable convnets v2 简体版

原文原文鏈接

論文地址：http://arxiv.org/abs/1811.11168html

做者：pprpgit

時間：2019年5月11日github

0. 摘要

DCNv1引入了可變形卷積，能更好的適應目標的幾何變換。可是v1可視化結果顯示其感覺野對應位置超出了目標範圍，致使特徵不受圖像內容影響（理想狀況是全部的對應位置分佈在目標範圍之內）。網絡

爲了解決該問題：提出v2, 主要有性能

擴展可變形卷積，加強建模能力
提出了特徵模擬方案指導網絡培訓：feature mimicking scheme

結果：性能顯著提高，目標檢測和分割效果領先。學習

1. 簡介

Geometric variations due to scale, pose, viewpoint and part deformation present a major challenge in object recognition and detection.測試

目標檢測一個主要挑戰：尺度，姿式，視角和部件變形引發的幾何變化ui

v1 引入兩個模塊：spa

Deformable Convolution : 可變形卷積
- 經過相對普通卷積基礎上添加的偏移解決
Deformable RoI pooling : 可變形 RoI pooling
- 在RoI pooling 中的bin學習偏移

爲了理解可變形卷積，進行了可視化操做：.net

samples for an activation unit tend to cluster around the object on which it lies.
激活單元樣本點彙集在目標附近
可是覆蓋範圍不夠精確，超出the area of interest

由此提出DCNv2, 具備加強建模的能力，可用於學習可變形卷積

with enhanced modeling power for learning deformable convolutions.

添加了兩種互補的模式：

更普遍應用可變形卷積，在更多層上使用可變形卷積
在原有基礎上不只加上偏移（offset），並且加上幅值（amplitude）的控制

爲了充分利用可變形卷積提取的信息，吸收知識蒸餾的手段，進行培訓。

教師網絡：R-CNN, 針對裁剪內容進行分類的一個網絡，防止學習不在目標範圍之外的內容
學生網絡：Faster R-CNN

2. 可變形卷積行爲分析

2.1 空間支持可視化

可視化三個內容：

有效感覺野：可視化感覺野
有效採樣位置：對採樣點求梯度，而後可視化
偏差界限顯著性區域：參考顯著性分析理論，進行可視化

2.2 可變形網絡空間支持

Faster R-CNN中Conv1-Conv4使用在Head中的，Conv5使用在Classification network上

ResNet-50 Conv5裏邊的3$\times$3的卷積層都使用可變形卷積替換。Aligned RoI pooling 由 Deformable RoI Pooling取代，當offset學習率設置爲0，那麼Deformable RoI Pooling就退化爲Aligned RoI Pooling。 ps: 這是V1中的操做。

從中觀察到：