【論文筆記】 R2CNN: Rotational Region CNN for Orientation Robust Scene Text Detection

這篇文章主要的貢獻點主要有兩個: 1)在RROI 階段,多尺度的pooling (7x7,3x11,11x3). 2)除了座標對齊的bbox座標迴歸,添加了inclined box的座標迴歸(x1,y1,x2,y2,h)。[注:x1,y1,x2,y2分佈是bbox按順時針方向定義的兩個角點] 網絡結構如下: 該方法的訓練集:1000(icdar15_trainingset)+ 2000(focus
相關文章
相關標籤/搜索