pip install pytesseract
報錯:tesseract is not installed or it's not in your path
- 下載安裝 Tesseract-OCR
- 修改 pytesseract 源碼中的路徑
- 文件位置: Python安裝目錄 \Lib\site-packages\pytesseract\pytesseract.py
- 將 tesseract_cmd 的值 改成 Tesseract-OCR 的安裝路徑\tesseract.exe
識別中文須要新的字庫
圖片:English.png
圖片:Chinese.png
識別
import pytesseract
from PIL import Image
im_en = Image.open('English.png')
im_ch = Image.open('Chinese.png')
print('========識別字母========')
print(pytesseract.image_to_string(im_en), '\n\n')
print('========識別中文========')
print(pytesseract.image_to_string(im_ch, lang='chi_sim'))
結果