MASTER: Multi-Aspect Non-local Network for Scene Text Recognition論文解讀

文章目錄 摘要 1. 網絡結構 2. 結果 摘要 深度學習用於文字識別現在在一些場景中已經很成熟了,主要就是分爲CTC和attention兩種方案。現在基於attention的方案主要用LSTM和GRU,這種方式的主要問題是:訓練和測試的都是one step by one step的,效率較低。 這篇文章提出了MASTER,其主要就是用CNN+Transformer的方式實現文字識別,這篇文章的主
相關文章
相關標籤/搜索