Tesseract-OCR識別中文與訓練字庫實例

關於中文的識別,效果比較好而且開源的應該就是Tesseract-OCR了,所以自己親身試用一下,分享到博客讓有同樣興趣的人少走彎路。 文中所用到的身份證圖片資源是百度找的,如有侵權可聯繫我刪除。   一、準備工作 1、下載Tesseract-OCR引擎,注意要3.0以上才支持中文哦,按照提示安裝就行。 2、下載chi_sim.traindata字庫。要有這個才能識別中文。下好後,放到Tessera
相關文章
相關標籤/搜索