Python + tesseract 進行文字識別

效果: 介紹: 這是基於Tesseract的OCR識別,設置中文包屬性", lang=‘chi_sim’",程序沒做界面 ,只是用遞歸方法遍歷文件夾內所有文件和文件夾,在程序旁邊的result文件夾內以相同文件結構放入識別結果。 效果對比: 類型 原圖 識別效果 代碼 白底黑字的長圖 有些顏色的 黑白分明的文字那是沒啥問題的 字跡清晰,儘量減少干擾像素是比較好的 英文的話就本身是識別器的強項了 宋
相關文章
相關標籤/搜索