論文地址:Generalized Intersection over Union 算法
度量檢測優劣基本基於 IOU,mAP 是典型的基於 IOU 的標準,可是 mAP 僅有一個 threshold,對於過了線的預測框一視同仁,不能進一步衡量其優劣,因此 MS COCO 挑戰賽提出了多 IOU 閾值的綜合 mAP 評價標準(就是同時採用幾個閾值,計算出多個 mAP 綜合打分)。ide
YOLO v1 直接回歸 bbox 的位置參數(x,y,h,w),並在(h,w)採用預測平方根的方式迴避尺度敏感函數
RCNN 預測的是相對預先檢測出的候選區的位置偏移,採用 log 空間迴避尺度敏感學習
此時的損失函數以 l2 爲主優化
Faster RCNN 提出 l1 smooth 損失函數,使得學習魯棒性更好spa
Faster RCNN 提出了 anchor boxes 取代了 RCNN 系列中的候選生成算法,可是過多的 anchor 候選框致使了正負樣本不平衡的問題,其做者進一步提出了 focal loss 進行應對(存疑,通常來講 one stage 法更易受到正負樣本不平衡的困擾,而 two stage 法因爲會在候選框階段經過得分和nms篩選過濾掉大量的負樣本,而後在分類迴歸階段又固定正負樣本比例,相較 one stage 法狀況會好不少)。orm
對於同形狀的 A 和 B,C 爲相同形狀的最小的能夠包含 A、B 的圖形(例如一般 A 和 B 是矩形框,此時 C 也取矩形框),下面公式給出 GIOU 的計算過程:blog
而後做者給出了 GIOU 的5個特色:繼承
基於 min、max 和 分段函數的BP算法是可行的,因此 IOU 與 GIOU 的應用就不是問題了。做者說,雖然 IOU(GIOU) 計算不能獲得解析解,但在限定了形狀爲矩形時就大大簡化了問題:對角點進行 min、max 操做便可:get
做者還畫了圖試圖證實 GIOU 損失函數的梯度相對於 IOU 損失函數更大,不過我感受有點牽強(沒看懂),因此不貼了。
做者將 GIOU 損失函數應用到已有 2D 物體檢測算法中,結果相對從前在兩個指標上:IOU、GIOU 均有提升,畢竟優化目標就是檢測指標,比起使用中間量的 l2 損失效果好是情理之中的。
文章源碼尚未被釋放,不過原理並不複雜,只要修改已有算法的損失函數便可,可是最近比較忙,沒有時間實踐一下了。我的以爲是篇很中肯的文章,期待其餘人復現實驗驗證一下,若是效果好說不定就像 BN、Relu 同樣成爲相關領域的標準配置了。