最近項目中用到二維碼圖片識別,在python下二維碼識別,目前主要有三個模塊:zbar 、zbarlight、zxing。html
#-*-coding=utf-8-*- import os import logging import zbar from PIL import Image import zxing import random import zbarlight logger=logging.getLogger(__name__) if not logger.handlers :logging.basicConfig(level=logging.INFO) DEBUG= (logging.getLevelName(logger.getEffectiveLevel())=='DEBUG') def ocr_qrcode_zbar(filename): img=Image.open(filename) width, height = img.size raw = img.tobytes() scanner = zbar.ImageScanner() scanner.parse_config('enable') #把圖像裝換成數據 zarimage = zbar.Image(width, height, 'Y800', raw) #掃描器進行掃描 scanner.scan(zarimage) data = '' for symbol in zarimage: # 對結果進行一些有用的處理 data += symbol.data if data: logger.debug(u'識別二維碼:%s,內容: %s' %(filename ,data)) else: logger.error(u'識別zbar二維碼出錯:%s' %(filename)) img.save('%s-zbar.jpg' %filename) return data def ocr_qrcode_zbarlight(filename): img=Image.open(filename) width, height = img.size raw = img.tobytes() #把圖像裝換成數據 data = zbarlight.qr_code_scanner(raw, width, height) if data: logger.debug(u'識別二維碼:%s,內容: %s' %(filename ,data)) else: logger.error(u'識別zbarlight二維碼出錯:%s' %(filename)) img.save('%s-zbar.jpg' %filename) return data def ocr_qrcode_zxing(filename): #在當前目錄生成臨時文件,規避java的路徑問題 img= Image.open(filename) ran= int(random.random()*100000) img.save('%s%s.jpg' %(os.path.basename(filename).split('.')[0],ran)) zx = zxing.BarCodeReader() data ='' zxdata = zx.decode('%s%s.jpg' %(os.path.basename(filename).split('.')[0],ran)) #刪除臨時文件 os.remove('%s%s.jpg' %(os.path.basename(filename).split('.')[0],ran)) if zxdata: logger.debug(u'zxing識別二維碼:%s,內容: %s' %(filename ,zxdata.data)) data = zxdata.data else: logger.error(u'識別zxing二維碼出錯:%s' %(filename)) img.save('%s-zxing.jpg' %filename) return data if __name__ == '__main__': filename =r'D:\python\00025328.jpg' #zbar二維碼識別 ltext = ocr_qrcode_zbar(filename) logger.info( u'[%s]Zbar二維碼識別:[%s]!!!' %(filename,ltext)) print ltext #zbarlight二維碼識別 ltext = ocr_qrcode_zbarlight(filename) logger.info( u'[%s]Zxing二維碼識別:[%s]!!!' %(filename,ltext)) print ltext #zxing二維碼識別 ltext = ocr_qrcode_zxing(filename) logger.info( u'[%s]Zxing二維碼識別:[%s]!!!' %(filename,ltext)) print ltext
一、zbar和zbarlight內核一致,都是基於zbar的dll編譯加載的。java
二、zbarlight使用比zbar更簡單,不過是在zbar的基礎又作了一點點封裝而已。python
三、zxing是基於java的zxing核心的python分支,其原理是調用javaw 加載zxing的core.jar包,再獲取輸出結果。算法
zxing的調試是一個大坑,網上的資料都存在這樣那樣的信息過期問題,加上zxing對java的依賴問題更多,這篇博客 http://www.cnblogs.com/oucsheep/p/6269813.html 相對來講比較清晰,可是估計初學者看起來會比較累。api
一、項目的圖片來源因而紙質文件的掃描件(qrcode),實際狀況相對複雜,存在打印偏移,與其餘文字重疊、圖片變形、色帶缺墨致使圖片殘缺等多種可能性。雖然通過一系列的圖片處理,但目前來看三個包在容錯性都不算太好。微信
二、可是,可是…… 微信中的「掃一掃」,卻能夠作到正常識別,應該是微信的二維碼識別是有本身的獨到算法,遺憾微信沒有開放接口,也沒有查到相關資料。dom
三、支付寶的"掃一掃",識別率略次於微信,可是也比開源的幾個包要強的多。spa
四、網上有一些付費api,識別率也通常,懷疑也是基於zxing和zbar的二次封裝。debug
五、三流無名廠家的二維碼掃描頭硬件,直接掃描該紙質文件,識別率基本能夠作到90%以上,固然這不排除是掃描轉換時產生的信息丟失這個重要因素。調試
綜上,以識別能力排序,硬件>微信>支付寶>zxing>zbarlight(zbar)。
軟件算法以微信最高,但比起硬件仍是有差距,期待高手破解或者剝離微信的算法,也歡迎商用api開發者進行交流(能夠付費),聯繫QQ 16906913 ,謝謝。
以上……