linux 安裝Tesseract-OCR

 

linux 安裝Tesseract-OCR

準備工做:
一.編譯環境: html

1. gcc gcc-c++ make(這個環境通常機器都具有,能夠忽略)  

linux

yum install gcc gcc-c++ make

 

2. 依賴的包: autoconf automake libtool libjpeg-devel libpng-devel libtiff-devel zlib-devel leptonica(1.67以上)c++

    autoconf automake libtool libjpeg-devel libpng-devel libtiff-devel zlib-devel 能夠經過yum安裝:centos

yum install autoconf automake libtool
yum install libjpeg-devel libpng-devel libtiff-devel zlib-devel

 

二. leptonica 須要源碼編譯安裝ide

 參考資料: 測試

http://paramountideas.com/tesseract-ocr-30-and-leptonica-installation-centos-55-and-opensuse-113 google

http://www.leptonica.org/source/README.html 編碼

下載leptonica 包: http://www.leptonica.org/source/leptonica-1.68.tar.gzidea


 解壓後切換到leptonica-1.68 根目錄  spa

./configure ;
make ; make install ;

 

三.tesseract安裝:
 依賴安裝完畢後開始安裝tesseract
 下載tesseract-3.01 安裝包: http://tesseract-ocr.googlecode.com/files/tesseract-3.01.tar.gz


 解壓後切換到tesseract-3.01 根目錄

  --若是在make時遇到相似strngs.h:1: error: stray '\357' in program 的錯誤,請將tesseract-3.01/ccutil/strngs.h 文件轉爲ANSI 編碼保存,再從新編譯

 

./autogen.sh

./configure

make

make install

ldconfig

tesseract英文語言包安裝:  
 下載tesseract-3.01 英文語言包: http://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.01.eng.tar.gz
 解壓後將tesseract-ocr/tessdata 下的全部文件所有拷貝到/usr/local/share/tessdata 下

安裝完畢.
測試一下:
 切換到解壓後的tesseract-3.01 根目錄(這個目錄下有一個自帶的phototest.tif 能夠作測試用)
 命令行:

tesseract phototest.tif phototest -l eng

 

輸出:

Tesseract Open Source OCR Engine v3.01 with Leptonica

Page 0

 

 這時應該在當前目錄生成一個phototest.txt 文本文件,內容就是phototest.tif 顯示的文字.   摘自 雪人的博客

相關文章
相關標籤/搜索