極驗漢字點選識別(一)----端到端不定長文字識別CRNN算法詳解

在以前的OCR任務中,識別過程分爲兩步:單字切割和分類任務。我們一般都會將一連串文字的文本文件先利用投影法(水滴法)切割出單個字體,在送入CNN裏進行文字分類。上述方法目前已經不再流行,面臨的顯而易見的問題就是容易造成將當個字符切開,導致後續分別出錯,而且漢字處理識別成本較高,當下更流行的是基於深度學習的端到端的文字識別,我們不需要顯示的對漢字進行切割,而是將漢字轉成序列學習問題,雖然輸入的圖像尺
相關文章
相關標籤/搜索