走進AI時代的文檔識別技術 之文檔重建

導讀:作者系騰訊QQ研發中心——CV應用研究組的totoralin。本文主要介紹基於深度學習的文檔重建框架,通過文檔校正、版面分析、字體識別和閱讀排序將紙質文檔智能轉成可編輯的電子文檔。相比較傳統的OCR技術,更加完整地恢復出文檔關鍵圖表等內容,提高用戶文檔處理的效率。 1、相關背景 隨着知識爆炸,藉助紙質媒體、網絡媒體等途徑每天我們都在接觸大量的信息。但是當我們發現某些信息是有啓發性、有價值的,
相關文章
相關標籤/搜索