文本檢測加識別:Mask TextSpotter

Framework (1)以特徵金字塔網絡(FPN)爲骨幹,提取feature map: 自然圖像中的文本大小各不相同。爲了在所有尺度上構建高層次的語義特徵圖,我們使用了一個深度爲50的ResNet[14]的特徵金字塔結構[32]主幹。FPN採用自頂向下的體系結構,融合了單尺度輸入的不同分辨率特性,提高了精度,同時降低了邊際成本。 (2)區域建議網絡(RPN)爲生成文本建議(ROI): RPN用於
相關文章
相關標籤/搜索