【論文】An End-to-End TextSpotter with Explicit Alignment and Attention

作者和相關鏈接 代碼鏈接:caffe代碼傳送門 摘要 在自然圖像當中的文本檢測與識別一直被認作是順序處理的兩個相對獨立的任務。由於學習困難和收斂率存在顯着差異,因此共同培訓兩項任務並非易事。在這項工作當中,我們呈現了一個迄今爲止簡單高效的框架,它能在一個統一的架構當中連續性的處理兩個任務。我們的主要貢獻包括以下的三個方面:(1)我們提出了一種新的文本對齊層,該層能夠計算任意方向下文本實例的卷積特徵
相關文章
相關標籤/搜索