Tesseract-OCR 字符識別---樣本訓練 [轉]

時間 2020-12-23

原文原文鏈接

Tesseract是一個開源的OCR（Optical Character Recognition，光學字符識別）引擎，可以識別多種格式的圖像文件並將其轉換成文本，目前已支持60多種語言（包括中文）。 Tesseract最初由HP公司開發，後來由Google維護，目前發佈在Googel Project上。地址爲http://code.google.com/p/tesseract-ocr/。使用

>>阅读原文<<