複雜場景下的OCR如何實現--深度學習算法綜述

時間 2021-07-13

原文原文鏈接

作者：北京矩視智能科技有限公司一、背景知識文本是人類最重要的信息來源之一，自然場景中充滿了形形色色的文字符號。在過去的十幾年中，研究人員一直在探索如何能夠快速準確的從圖像中讀取文本信息，也就是現在OCR技術。工業場景下的圖像文本識別更爲複雜，它會出現在許多不同的情景下，如醫藥包裝上的文字、各類鋼製零部件上的字符、集裝箱表面噴印的字符、商鋪Logo上的個性化字符等等。在這類圖像中，文字部分可

>>阅读原文<<