Linux Tesseract-OCR安裝與訓練樣本

  1. 安裝對應的lib (install the libs)html

   參考:http://www.eefocus.com/winter1988/blog/13-03/292209_03d5b.htmljava

sudo apt-get install autoconf automake libtool
sudo apt-get install libpng12-dev
sudo apt-get install libjpeg62-dev
sudo apt-get install libtiff4-dev
sudo apt-get install zlib1g-dev


確保安裝下面的lib:google

 sudo apt-get install  gcc
 sudo apt-get install  g++
 sudo apt-get install  automake


安裝Leptonica:spa

$wget http://leptonica.googlecode.com/files/leptonica-1.69.tar.gz

$tar zxvf leptonica-1.69.tar.gz


cd到其目錄下:.net

./configure && make && sudo make install


安裝 Tesseract:3d

$wget http://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.02.tar.gz

$tar zxvf tesseract-ocr-3.02.02.tar.gz

 

cd到其目錄下:code

./configure && make && sudo make install

Install 後 須要 sudo ldconfig 
orm

使用訓練包的話須要先安裝英文包htm

設置 TESSDATA_PREFIX 語言包所在的目錄(語言包在Win下訓練好後直接導入tessdata目錄下便可)blog

export TESSDATA_PREFIX=/usr/tesseract-ocr/


2.訓練樣本

參考:http://blog.csdn.net/yasi_xi/article/details/8763385

          http://blog.csdn.net/marvinhong/article/details/8459591

須要注意的是最後五個包的重命名

相關文章
相關標籤/搜索