【論文閱讀】Arbitrary Shape Scene Text Detection with Adaptive Text Region Representation

思想 本論文與Unet方法不同,用Mask R-CNN類的方法來實現任意形狀文本的檢測,其中,它借用FPN網絡的對矩形框的優異的檢測性能,很好的找出文本的區域的矩形框,而後,通過一個基於LSTM的refine proposal模塊來細緻的描繪文本區,這巧妙的通過roi-pooling layer得到的特徵進行任意形狀框的迴歸(將feature作爲LSTM每個step的輸入,然後迴歸出任意長度點的序
相關文章
相關標籤/搜索