『計算機視覺』Generalized Intersection over Union: A Metric and A Loss for Bounding BoxRegression

時間 2019-11-05

標籤計算機視覺 generalized intersection union metric loss bounding boxregression 欄目快樂工作简体版

原文原文鏈接

論文地址：Generalized Intersection over Union 算法

1、相關工做

目標檢測精度標準

度量檢測優劣基本基於 IOU，mAP 是典型的基於 IOU 的標準，可是 mAP 僅有一個 threshold，對於過了線的預測框一視同仁，不能進一步衡量其優劣，因此 MS COCO 挑戰賽提出了多 IOU 閾值的綜合 mAP 評價標準（就是同時採用幾個閾值，計算出多個 mAP 綜合打分）。ide

Bounding box 表示方法和損失函數

YOLO v1 直接回歸 bbox 的位置參數（x，y，h，w），並在（h，w）採用預測平方根的方式迴避尺度敏感函數

RCNN 預測的是相對預先檢測出的候選區的位置偏移，採用 log 空間迴避尺度敏感學習

此時的損失函數以 l2 爲主優化

Faster RCNN 提出 l1 smooth 損失函數，使得學習魯棒性更好spa

Faster RCNN 提出了 anchor boxes 取代了 RCNN 系列中的候選生成算法，可是過多的 anchor 候選框致使了正負樣本不平衡的問題，其做者進一步提出了 focal loss 進行應對（存疑，通常來講 one stage 法更易受到正負樣本不平衡的困擾，而 two stage 法因爲會在候選框階段經過得分和nms篩選過濾掉大量的負樣本，而後在分類迴歸階段又固定正負樣本比例，相較 one stage 法狀況會好不少）。orm

2、Generalized Intersection over Union

一、IOU 的優勢

將 1-IOU 做爲距離度量，（數學可證的）知足非負性、同一性、對稱性和三角不等性（non-negativity, identity of indiscernibles, symmetry and triangle inequality）
IOU 具備尺度不變性，不受 bbox 於 ground truth 的大小影響

二、IOU 的問題

只要兩個框不相交，IOU 就爲0，這使得它沒法衡量兩個框是相鄰仍是相距甚遠
IOU 沒法反映兩個框相交的方式，解釋如 Figure2 所示：

三、GIOU 算法介紹

對於同形狀的 A 和 B，C 爲相同形狀的最小的能夠包含 A、B 的圖形（例如一般 A 和 B 是矩形框，此時 C 也取矩形框），下面公式給出 GIOU 的計算過程：blog

而後做者給出了 GIOU 的5個特色：繼承

將 1-GIOU 做爲距離度量，其繼承了 IOU 的優良數學特性
GIOU 一樣具備尺度不變性
GIOU 永遠小於 IOU，且當 A 趨近於 B 時（即二者趨於重合），GIOU 趨於 IOU
IOU 取值區間爲 [0，1]，GIOU 取值區間爲 [-1，1]：
　　和 3 中所說對應，A 和 B 趨於重合時 IOU 和 GIOU 均趨向 1
　　A 和 B 差異越大，GIOU 趨向於 -1
如 Figure2 所示，GIOU 相對 IOU 更能反映兩個框相交形式的好壞（how overlap between two symmetrical objectsoccurs）