tesseract-ocr識別英文和中文圖片文字以及掃描圖片實例講解

OCR(Optical Character Recognition):光學字符識別,是指對圖片文件中的文字進行分析識別,獲取的過程。 Tesseract:開源的OCR識別引擎,初期Tesseract引擎由HP實驗室研發,後來貢獻給了開源軟件業,後經由Google進行改進,消除bug,優化,重新發布。當前版本爲3.02 項目下載地址爲:http://jaist.dl.sourceforge.net/
相關文章
相關標籤/搜索