python 圖像識別

這是一個最簡單的圖像識別,將圖片加載後直接利用Python的一個識別引擎進行識別
將圖片中的數字經過 pytesseract.image_to_string(image) 識別後將結果存入到本地的txt文件中
複製代碼
 1 #-*-encoding:utf-8-*-
 2 import pytesseract
 3 from PIL import Image
 4 
 5 class GetImageDate(object):
 6     def m(self):
 7         image = Image.open(u"a.png")
 8         text = pytesseract.image_to_string(image)
 9         return text
10 
11     def SaveResultToDocument(self):
12         text = self.m()
13         f = open(u"Verification.txt","w")
14         print text
15         f.write(str(text))
16         f.close()
17 
18 g = GetImageDate()
19 g.SaveResultToDocument()
複製代碼
 
具體想要實現上面的代碼須要安裝兩個包和一個引擎
在安裝以前須要先安裝好Python,pip並配置好環境變量
全部包的安裝都是經過pip來安裝的,須要在windows PowerShell中進行,而且是在 C:\Python27\Scripts目錄下
1.第一個包: pytesseract
pip install pytesseract
如果出現安裝錯誤的狀況,安裝不了的時候,能夠將命令改成 pip.exe install pytesseract來安裝
如果將pip修改成pip.exe安裝成功後,那麼下文的全部pip都須要改成pip.exe
2.第二個包:PIL安裝
pip install PIL
如果失敗了能夠以下修改 pip install PILLOW
3.安裝識別引擎tesseract-ocr
https://github.com/tesseract-ocr/tesseract
下載 tesseract-ocr,進行默認安裝
安裝完成後須要配置環境變量,在系統變量path後增長 tesseract-ocr的安裝地址C:\Program Files (x86)\Tesseract-OCR;
一切都安裝完成後運行上述代碼,會發現報錯,此時須要
 
至此結束
相關文章
相關標籤/搜索