mac上Tesseract3.04.01_2樣本訓練

安裝tesseract

brew uninstall tesseract
brew install --with-training-tools tesseract

構建字符集

  • 合併爲tif
    tools-Merge Tiffhtml

保存爲num.myfont.exp0.tif工具

  • 生成box測試

tesseract num.myfont.exp0.tif num.myfont.exp0 -l eng -psm 7 batch.nochop makebox
  • 使用jTessBoxEditor修改box文件ui

  • 生產font_properties.net

echo myfont 0 0 0 0 0 >font_properties
  • 生成訓練文件code

tesseract num.myfont.exp0.tif num.myfont.exp0 -l eng -psm 7 nobatch box.train
  • 生成字符集文件orm

unicharset_extractor num.myfont.exp0.box
  • 生成shapehtm

shapeclustering -F font_properties -U unicharset -O myfont.unicharset num.myfont.exp0.tr
  • 聚合字符特徵文件blog

mftraining -F font_properties -U unicharset -O myfont.unicharset num.myfont.exp0.tr
  • 正常化get

cntraining num.myfont.exp0.tr
  • 合併訓練文件

cp normproto myfont.normproto
cp inttemp myfont.inttemp
cp pffmtable myfont.pffmtable
cp unicharset myfont.unicharset
cp shapetable myfont.shapetable
combine_tessdata myfont.

新增語言

brew list tesseract

查看tessdata位置

cp myfont.traineddata /usr/local/Cellar/tesseract/3.04.01_2/share/tessdata/
tesseract --list-langs

測試

tesseract 9606.tif output -l myfont -psm 7

doc

相關文章
相關標籤/搜索