CVPR 2020 論文大盤點-文本圖像篇

本文盤點CVPR 2020 所有文本圖像(text)相關論文,主要分爲手寫文本場景文本兩大方向,總計16篇,對文獻進行了細緻的分類,大部分論文是圍繞識別問題的研究。

方向包括:

1)場景文本檢測(Scene Text Detection),從街景等場景文本中檢測文本的位置,2 篇文獻均爲不規則任意形狀文本的檢測;

2)場景文本識別(Scene Text Recognition),對場景文本檢測得到的結果進行識別,共 4 篇文章;

3)手寫文本識別(Handwritten Text Recognition),2 篇文章;

4)場景文本端到端識別(Scene Text Spotting),1 篇文章,即華南理工大學和阿德萊德大學學者提出的實時 ABCNet 算法,很吸引人,已經開源;

5)手寫文本生成(Handwritten Text Generation),爲了增加手寫文本的訓練樣本(感覺也可以用來「寫作業」),1 篇文章;

6)場景文本合成(Scene Text Synthesis),爲了增加場景文本的訓練樣本,1 篇文章,出自曠視科技,UnrealText用渲染引擎生成逼真場景文本;

7)文本圖像的數據增廣,用於手寫和場景文本識別算法的訓練,1 篇文章;

8)場景文本編輯(Scene Text Editor),對場景文本圖像中的文字進行替換;

9)碎紙文檔重建,用於刑偵領域的文檔被破壞成碎片後的重建,1篇;

10)文本風格遷移,1篇;

11)場景文本識別的對抗攻擊研究,1篇;

12)筆跡鑑定,1篇。

值得一提的,16篇文章中10篇已經開源或者準備開源,感謝這些開發者~

已經開源或者即將開源的論文,把代碼地址也附上了。

大家可以在:

http://openaccess.thecvf.com/CVPR2020.py

按照題目下載這些論文。

如果想要下載所有CVPR 2020論文,請點擊這裏:

CVPR 2020 論文全面開放下載,含主會和workshop

   場景文本檢測

深度關係推理圖網絡用於任意形狀文本檢測

[1].Deep Relational Reasoning Graph Network for Arbitrary Shape Text Detection

作者 | Shi-Xue Zhang, Xiaobin Zhu, Jie-Bo Hou, Chang Liu, Chun Yang, Hongfa Wang, Xu-Cheng Yin

單位 | 北京科技大學中國科學技術大學人工智能聯合實驗室;騰訊科技(深圳)

代碼 | https://github.com/GXYM/DRRG

備註 | CVPR 2020 Oral

解讀 | https://blog.csdn.net/SpicyCoder/article/details/105072570

[2].ContourNet: Taking a Further Step Toward Accurate Arbitrary-Shaped Scene Text Detection

作者 | Yuxin Wang, Hongtao Xie, Zheng-Jun Zha, Mengting Xing, Zilong Fu, Yongdong Zhang

單位 | 中國科學技術大學

代碼 | https://github.com/wangyuxin87/ContourNet

解讀 | https://zhuanlan.zhihu.com/p/135399747

   場景文本識別

論場景文本識別中的詞彙依賴性

[3].On Vocabulary Reliance in Scene Text Recognition

作者 | Zhaoyi Wan, Jielei Zhang, Liang Zhang, Jiebo Luo, Cong Yao

單位 | 曠視;中國礦業大學羅切斯特大學

[4].SCATTER: Selective Context Attentional Scene Text Recognizer

作者 | Ron Litman, Oron Anschel, Shahar Tsiper, Roee Litman, Shai Mazor, R. Manmatha

單位 | Amazon Web Services

語義推理網絡,用於場景文本的精確識別

[5].Towards Accurate Scene Text Recognition With Semantic Reasoning Networks

作者 | Deli Yu, Xuan Li, Chengquan Zhang, Tao Liu, Junyu Han, Jingtuo Liu, Errui Ding

單位 | 國科大;百度;中科院

代碼 | https://github.com/chenjun2hao/SRN.pytorch

語義增強的編解碼框架,用於識別低質量圖像(模糊、光照不均、字符不完整等)場景文本

[6].SEED: Semantics Enhanced Encoder-Decoder Framework for Scene Text Recognition

作者 | Zhi Qiao, Yu Zhou, Dongbao Yang, Yucan Zhou, Weiping Wang

單位 | 中科院;國科大

代碼 | https://github.com/Pay20Y/SEED(即將)

   手寫文本識別

[7].OrigamiNet: Weakly-Supervised, Segmentation-Free, One-Step, Full Page Text Recognition by learning to unfold

作者 | Mohamed Yousef, Tom E. Bishop

單位 | Intuition Machines, Inc

代碼 | https://github.com/IntuitionMachines/OrigamiNet

   Scene Text Spotting

實時端到端場景文本識別

[8].ABCNet: Real-Time Scene Text Spotting With Adaptive Bezier-Curve Network

作者 | Yuliang Liu, Hao Chen, Chunhua Shen, Tong He, Lianwen Jin, Liangwei Wang

單位 | 華南理工大學;阿德萊德大學;

代碼 | https://github.com/Yuliang-Liu/bezier_curve_text_spotting

備註 | CVPR 2020 Oral

解讀 | https://zhuanlan.zhihu.com/p/146276834

   手寫文本生成

半監督變長手寫文本生成,增加文本數據集,提高識別算法精度

[9].ScrabbleGAN: Semi-Supervised Varying Length Handwritten Text Generation

作者 | Sharon Fogel, Hadar Averbuch-Elor, Sarel Cohen, Shai Mazor, Roee Litman

單位 | 以色列國,Amazon Rekognition;康奈爾大學

代碼 | https://github.com/amzn/convolutional-handwriting-gan

   場景文本合成

使用渲染引擎合成場景文本,增加訓練樣本,提升識別算法精度

[10].UnrealText: Synthesizing Realistic Scene Text Images From the Unreal 

作者 | WorldShangbang Long, Cong Yao

單位 | 卡內基梅隆大學;曠視

代碼 | https://jyouhou.github.io/UnrealText/

解讀 | https://zhuanlan.zhihu.com/p/137406773

   數據增廣+文本識別

圖像增廣用於手寫與場景文本識別

[11].Learn to Augment: Joint Data Augmentation and Network Optimization for Text Recognition

作者 | Canjie Luo, Yuanzhi Zhu, Lianwen Jin, Yongpan Wang

單位 | 華南理工大學;阿里

代碼 | https://github.com/Canjie-Luo/Text-Image-Augmentation

   場景文本編輯

[12].STEFANN: Scene Text Editor Using Font Adaptive Neural Network

作者 | Prasun Roy, Saumik Bhattacharya, Subhankar Ghosh, Umapada Pal

單位 | 印度統計研究所;印度理工學院

代碼 | https://github.com/prasunroy/stefann

網站 | https://prasunroy.github.io/stefann/

   碎紙文檔重建

破碎紙片重建文檔,用於法醫等刑偵調查

[13].Fast(er) Reconstruction of Shredded Text Documents via Self-Supervised Deep Asymmetric Metric Learning

作者 | Thiago M. Paixao, Rodrigo F. Berriel, Maria C. S. Boeres, Alessandro L. Koerich, Claudine Badue, Alberto F. De Souza, Thiago Oliveira-Santos

單位 | IFES,Brazil;UFES,Brazil;ETS,Canada

   文本風格遷移

[14].SwapText: Image Based Texts Transfer in Scenes

作者 | Qiangpeng Yang, Jun Huang, Wei Lin

單位 | 阿里

   場景文本識別+對抗攻擊

[15].What Machines See Is Not What They Get: Fooling Scene Text Recognition Models With Adversarial Text Images

作者 | Xing Xu, Jiefu Chen, Jinhui Xiao, Lianli Gao, Fumin Shen, Heng Tao Shen

單位 | 電子科技大學

   筆跡鑑定

[16].Sequential Motif Profiles and Topological Plots for Offline Signature Verification

作者 | Elias N. Zois, Evangelos Zervas, Dimitrios Tsourounis, George Economou

單位 | University of West Attica ;派圖拉斯大學

往期"精彩閱讀"

END

備註:ocr

OCR交流羣

文本檢測、識別、編輯等更多最新技術,若已爲CV君其他賬號好友請直接私信。

我愛計算機視覺

微信號:aicvml

QQ羣:805388940

微博知乎:@我愛計算機視覺

投稿:[email protected]

網站:www.52cv.net

在看,讓更多人看到