做者電腦:Mac Mini 系統信息:OS X EI Capitan 10.11.6html
Tesseract4.0github地址:https://github.com/tesseract-ocr/tesseract/wiki/4.0-with-LSTMgit
build 步驟:github
參考Tesseract github上的官方文檔:https://github.com/tesseract-ocr/tesseract/wiki/Compiling#macosmacos
直接在終端中輸入:ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"c#
安裝過程當中須要鍵入一次回車api
2. 使用brew命令安裝依賴xcode
brew install automake autoconf brew install autoconf-archive brew install pkgconfig brew install icu4c brew install leptonica brew install gcc
3. compile
git clone https://github.com/tesseract-ocr/tesseract/
在這一步可能會有錯誤提示:
fatal: could not create work tree dir 'tesseract': Permission deniedruby
此時須要咱們使用sudo命令建立一個具備寫權限的文件夾,而後把tesseract的源碼clone至此文件中curl
也可能有錯誤提示:測試
Agreeing to the Xcode/iOS license requires admin privileges, please re-run as root via sudo.
咱們須要:
一、打開終端,輸入 sudo xcodebuild -license
二、終端提示敲回車鍵(enter)打開許可協議,照作
三、終端提示 按下 「space」 鍵閱讀許可協議,按「q」 不閱讀
四、最終,終端會出現三個選項,agree 、print、cancel,不用想,能不是agree 嗎!輸入agree,而後enter
4. 接下來:
cd tesseract
./autogen.sh
這一步可能會有錯誤:「
./configure CC=gcc-6 CXX=g++-6 CPPFLAGS=-I/usr/local/opt/icu4c/include LDFLAGS=-L/usr/local/opt/icu4c/lib
make -j
sudo make install # if desired
make training
5.試一下好很差使
首先要下載相關語言的數據文件,英語數據文件下載地址:eng.traineddata 其餘數據文件下載地址:https://github.com/tesseract-ocr/tesseract/wiki/Data-Files#data-files-for-version-400
數據文件下載完成後,須要把它move到:/tesseract/tessdata 路徑下
而後若是出現錯誤:
Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory.
就使用命令:
export TESSDATA_PREFIX=/Users/naver/code/tesseract/
接下來要提早建立一個文件來存儲識別的文字結果,如:out
而後輸入測試命令:
tesseract /Users/naver/Downloads/test.jpg out
test.jpg 爲要識別的圖片,而後識別結果會存儲在out文件中。
詳細參數介紹參見官方github文檔:https://github.com/tesseract-ocr/tesseract/wiki/Command-Line-Usage
其餘參考連接:
http://blog.csdn.net/xiaochunyong/article/details/7193744
http://www.zmonster.me/2015/04/17/tesseract-install-usage.html
http://git.malu.me/tesseract%E4%BD%BF%E7%94%A8%E8%AE%B0%E5%BD%95/