複雜場景下的OCR如何實現--深度學習算法綜述

作者:北京矩視智能科技有限公司 一、背景知識 文本是人類最重要的信息來源之一,自然場景中充滿了形形色色的文字符號。在過去的十幾年中,研究人員一直在探索如何能夠快速準確的從圖像中讀取文本信息,也就是現在OCR技術。 工業場景下的圖像文本識別更爲複雜,它會出現在許多不同的情景下,如醫藥包裝上的文字、各類鋼製零部件上的字符、集裝箱表面噴印的字符、商鋪Logo上的個性化字符等等。 在這類圖像中,文字部分可
相關文章
相關標籤/搜索