場景文字檢測閱讀筆記

1. PSENet PSENet 的兩大特點:1. 基於像素分割 2. 基於小 Kenel 進行擴展得到最終標定框。 具體來說特點 2,模型首先生成與文本形狀類似的小 Kenel,然後採用逐步規模擴展(progressive scale expasion)來合併像素。網絡結構如下: 圖片左邊爲 FPN,P3、P4、P5 進行上採樣,然後和 P2 進行 concat,F 表示 feature map
相關文章
相關標籤/搜索