Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regressiongit
2019-05-20 19:34:55github
Paper: https://arxiv.org/pdf/1902.09630.pdf 算法
Project page: https://giou.stanford.edu/ 函數
Code: https://github.com/generalized-iou 性能
1. Background and Motivation: 優化
IoU (Intersection over Union) 是物體檢測領域最經常使用的評價指標,用於衡量任意兩個形狀之間的類似性。IoU 將物體的形狀信息,如:width,height,and locations of two bounding boxes,編碼爲 region property,而後計算一個聚焦於該區域的度量。這個性質使得 IoU 對 scale 有不變性。因爲具備這樣的特色,IoU 被普遍的應用於物體檢測,分割,跟蹤等任務。編碼
從上述內容能夠發現,最小化經常使用的損失 與 改善他們的 IoU 值,之間並無強烈的關係。如圖 1(a)所示:(綠色的BBox 爲真值,黑色的爲預測的結果)spa
爲了簡化起見,咱們假設兩個 BBox 的一個角固定,因此,任何預測的 BBox,只要第二個角在圓周線上,將會產生相同的 l2-norm distance;然而,IoU值卻明顯的不一樣。能夠發現,regression loss 的優化 和 IoU values 之間的 gap,並不能很簡單的跨越。orm
本文針對該問題,探索了 IoU 的新的計算方法。做者這裏借鑑了 UnitBox 的思想,直接將 BBox 做爲優化目標進行迴歸。因此,將 IoU 做爲 2D 物體檢測任務的目標函數就更適合了。可是,IoU 做爲 metric 和 loss 有以下的不足:若是兩個物體根本沒有重合,那麼 IoU value 將會是 0,而且不會反應兩個 BBox 到底有多遠。在這種不重合的狀況下,若是用了 IoU 做爲損失函數,那麼梯度將會爲 0,沒法進行優化。blog
在本文中,做者經過解決這個不重合的問題,克服了 IoU 的弱點。做者確保其拓展版本的有以下的特性:
a). 與 IoU 同樣,擁有相同的定義,即:將對比物體的形狀屬性編碼爲區域屬性(region property);
b). 保持了 IoU 的尺寸不變性;
c). 確保了在重合物體上與 IoU 的強烈相關性;
咱們引入該 generalized verison of IoU, named GIoU, 做爲一種新的對比方式。也提供了一種分析性的方案,來計算 GIoU,容許其做爲 loss function。將 GIoU loss 引入到頂尖的物體檢測算法中,咱們的方法穩定的提高了其在主流物體檢測benchmark 上檢測性能。
2. Generalized Intersection over Union :
常規的 IoU 的定義以下:
IoU 有以下的兩個優點:
1). IoU 做爲距離,能夠看作是一種 metric;
2). IoU 對問題的尺寸具備不變性(Invariant to the scale of the problem);
與此同時,也有以下的一個劣勢:若是兩個 BBox 不重合,那麼其 IoU 得分就是 0。那麼,此時的 IoU 沒法反映出兩個BBox 真實的距離。
做者提出的 GIoU 能夠很好的解決這個問題,具體的計算方式以下:
首先,計算兩個 BBox A 和 B 的 smallest convex shapes C, 同時包含 A and B;
而後,咱們計算以下的比值:分子是 排除 A 和 B 後的 C的區域,分母是 C 的總面積;這個表達了 A 和 B 之間的空閒區域的大小比例;
最終,將 IoU 的值,減去上述的比值,就能夠獲得 GIoU 的值。
上圖中的綠色區域,即展現了所要計算的區域 C 的面積。
3. Experiments: