『計算機視覺』Generalized Intersection over Union: A Metric and A Loss for Bounding BoxRegression

論文地址:Generalized Intersection over Union 算法

1、相關工做

目標檢測精度標準

度量檢測優劣基本基於 IOU,mAP 是典型的基於 IOU 的標準,可是 mAP 僅有一個 threshold,對於過了線的預測框一視同仁,不能進一步衡量其優劣,因此 MS COCO 挑戰賽提出了多 IOU 閾值的綜合 mAP 評價標準(就是同時採用幾個閾值,計算出多個 mAP 綜合打分)。ide

Bounding box 表示方法和損失函數

YOLO v1 直接回歸 bbox 的位置參數(x,y,h,w),並在(h,w)採用預測平方根的方式迴避尺度敏感函數

RCNN 預測的是相對預先檢測出的候選區的位置偏移,採用 log 空間迴避尺度敏感學習

此時的損失函數以 l2 爲主優化

Faster RCNN 提出 l1 smooth 損失函數,使得學習魯棒性更好spa

Faster RCNN 提出了 anchor boxes 取代了 RCNN 系列中的候選生成算法,可是過多的 anchor 候選框致使了正負樣本不平衡的問題,其做者進一步提出了 focal loss 進行應對(存疑,通常來講 one stage 法更易受到正負樣本不平衡的困擾,而 two stage 法因爲會在候選框階段經過得分和nms篩選過濾掉大量的負樣本,而後在分類迴歸階段又固定正負樣本比例,相較 one stage 法狀況會好不少)。orm

2、Generalized Intersection over Union

一、IOU 的優勢

  1. 將 1-IOU 做爲距離度量,(數學可證的)知足非負性、同一性、對稱性和三角不等性(non-negativity, identity of indiscernibles, symmetry and triangle inequality
  2. IOU 具備尺度不變性,不受 bbox 於 ground truth 的大小影響

二、IOU 的問題

  1. 只要兩個框不相交,IOU 就爲0,這使得它沒法衡量兩個框是相鄰仍是相距甚遠
  2. IOU 沒法反映兩個框相交的方式,解釋如 Figure2 所示:

 三、GIOU 算法介紹

對於同形狀的 A 和 B,C 爲相同形狀的最小的能夠包含 A、B 的圖形(例如一般 A 和 B 是矩形框,此時 C 也取矩形框),下面公式給出 GIOU 的計算過程:blog

而後做者給出了 GIOU 的5個特色:繼承

  1. 將 1-GIOU 做爲距離度量,其繼承了 IOU 的優良數學特性
  2. GIOU 一樣具備尺度不變性
  3. GIOU 永遠小於 IOU,且當 A 趨近於 B 時(即二者趨於重合),GIOU 趨於 IOU
  4. IOU 取值區間爲 [0,1],GIOU 取值區間爲 [-1,1]:
      和 3 中所說對應,A 和 B 趨於重合時 IOU 和 GIOU 均趨向 1
      A 和 B 差異越大,GIOU 趨向於 -1
  5. 如 Figure2 所示,GIOU 相對 IOU 更能反映兩個框相交形式的好壞(how overlap between two symmetrical objectsoccurs

四、GIOU 應用爲損失函數

基於 min、max 和 分段函數的BP算法是可行的,因此 IOU 與 GIOU 的應用就不是問題了。做者說,雖然 IOU(GIOU) 計算不能獲得解析解,但在限定了形狀爲矩形時就大大簡化了問題:對角點進行 min、max 操做便可:get

做者還畫了圖試圖證實 GIOU 損失函數的梯度相對於 IOU 損失函數更大,不過我感受有點牽強(沒看懂),因此不貼了。

3、實驗

做者將 GIOU 損失函數應用到已有 2D 物體檢測算法中,結果相對從前在兩個指標上:IOU、GIOU 均有提升,畢竟優化目標就是檢測指標,比起使用中間量的 l2 損失效果好是情理之中的。

文章源碼尚未被釋放,不過原理並不複雜,只要修改已有算法的損失函數便可,可是最近比較忙,沒有時間實踐一下了。我的以爲是篇很中肯的文章,期待其餘人復現實驗驗證一下,若是效果好說不定就像 BN、Relu 同樣成爲相關領域的標準配置了。

相關文章
相關標籤/搜索