Tesseract-OCR引擎 入門 (轉)

OCR(Optical Character Recognition):光學字符識別,是指對圖片文件中的文字進行分析識別,獲取的過程。 Tesseract:開源的OCR識別引擎,初期Tesseract引擎由HP實驗室研發,後來貢獻給了開源軟件業,後經由Google進行改進,消除bug,優化,重新發布。當前版本爲3.01. 項目地址爲:http://code.google.com/p/tesserac
相關文章
相關標籤/搜索