Tesseract-OCR 字符識別---樣本訓練

        Tesseract是一個開源的OCR(Optical Character Recognition,光學字符識別)引擎,能夠識別多種格式的圖像文件並將其轉換成文本,目前已支持60多種語言(包括中文)。 Tesseract最初由HP公司開發,後來由Google維護,目前發佈在Googel Project上。地址爲http://code.google.com/p/tesseract-oc
相關文章
相關標籤/搜索