FCN和RPN兩種特徵提取框架的區別

場景文本檢測的難點主要在於目標的方向、形狀、尺度變化顯著,且天然場景背景複雜。現有的基於深度學習的場景文本檢測框架大體分爲兩類: 一類基於FCN框架提取文本顯著圖,但此類方法引入大量噪聲干擾結果準確性(由於最後要上採樣匹配),需對顯著圖進行後處理(如:反捲積),沒法實現端到端; 一類基於RPN框架提取proposal進行分類,但文本目標形狀、方向、尺度的變化將proposal的搜索空間極大增大,使
相關文章
相關標籤/搜索