Tesseract-OCR識別中文與訓練字庫實例

時間 2021-01-04

原文原文鏈接

關於中文的識別，效果比較好而且開源的應該就是Tesseract-OCR了，所以自己親身試用一下，分享到博客讓有同樣興趣的人少走彎路。文中所用到的身份證圖片資源是百度找的，如有侵權可聯繫我刪除。一、準備工作 1、下載Tesseract-OCR引擎，注意要3.0以上才支持中文哦，按照提示安裝就行。 2、下載chi_sim.traindata字庫。要有這個才能識別中文。下好後，放到Tessera

>>阅读原文<<