Tesseract-OCR 字符識別---樣本訓練 [轉]

Tesseract是一個開源的OCR(Optical Character Recognition,光學字符識別)引擎,可以識別多種格式的圖像文件並將其轉換成文本,目前已支持60多種語言(包括中文)。 Tesseract最初由HP公司開發,後來由Google維護,目前發佈在Googel Project上。地址爲http://code.google.com/p/tesseract-ocr/。   使用
相關文章
相關標籤/搜索