MASK-RCNN(1)

MASK-RCNN是一個多用途的網絡,能夠用來作目標檢測,實例分割或者人體姿態識別.主要結構以下.網絡

簡單的說,就是首先用Faster-RCNN得到ROI,再進行ROI Align,而後輸出ROI的分類,同時輸出分割掩碼.spa

1. Faster-RCNN和ROI Alignblog

Faster-RCNN是一個兩階段檢測器,第一階段(即RPN)提出候選ROI,再過濾掉一部分,第二階段對剩下的ROI進行分類.ast

MASK-RCNN對Faster-RCNN作了修改,得到ROI之後並無立刻輸出分類,而是進行了ROI Align.ROI Align經過雙線性插值得到準確的特徵圖,而不是四捨五入之後的特徵圖.例如,若是輸出的ROI座標是[x/16],其中16是特徵圖步幅,[⋅]表示四捨五入,這樣得到的特徵圖和ROI的座標並無徹底對端,雖然對分類影響不大,可是對掩碼的輸出影響較大.ROI Align經過雙線性插值得到準確的特徵圖,以下圖所示.im

本站公眾號
   歡迎關注本站公眾號,獲取更多信息