利用jTessBoxEditor工具進行Tesseract3.02.02樣本訓練,提高驗證碼識別率

1、背景 前文已經簡要介紹tesseract ocr引擎的安裝及基本使用,其中提到使用-l eng參數來限定語言庫,可以提高識別準確率及識別效率。 本文將針對某個網站的驗證碼進行樣本訓練,形成自己的語言庫,來提高驗證碼識別率。   2、準備工具 tesseract樣本訓練有一個官方流程說明,https://github.com/tesseract-ocr/tesseract/wiki/Traini
相關文章
相關標籤/搜索