有關python下二維碼識別用法及識別率對比分析

 最近項目中用到二維碼圖片識別,在python下二維碼識別,目前主要有三個模塊:zbar 、zbarlight、zxing。html

一、三個模塊的用法:

#-*-coding=utf-8-*-
import os 
import logging
import zbar 
from PIL import Image 
import zxing
import random
import zbarlight

logger=logging.getLogger(__name__)
if not logger.handlers :logging.basicConfig(level=logging.INFO)
DEBUG= (logging.getLevelName(logger.getEffectiveLevel())=='DEBUG')  


def ocr_qrcode_zbar(filename):
    img=Image.open(filename)
    width, height = img.size
    raw = img.tobytes()
    
    scanner = zbar.ImageScanner()
    scanner.parse_config('enable')        
    #把圖像裝換成數據
    zarimage = zbar.Image(width, height, 'Y800', raw)    
    #掃描器進行掃描
    scanner.scan(zarimage)
    
    data = '' 
    for symbol in zarimage:
        # 對結果進行一些有用的處理
        data += symbol.data 
    if data:
        logger.debug(u'識別二維碼:%s,內容: %s' %(filename ,data))
    else:
        logger.error(u'識別zbar二維碼出錯:%s' %(filename))
        img.save('%s-zbar.jpg' %filename)  
    return data 

def ocr_qrcode_zbarlight(filename):
    img=Image.open(filename)

    width, height = img.size
    raw = img.tobytes()
        
    #把圖像裝換成數據
    data = zbarlight.qr_code_scanner(raw, width, height)    

    if data:
        logger.debug(u'識別二維碼:%s,內容: %s' %(filename ,data))
    else:
        logger.error(u'識別zbarlight二維碼出錯:%s' %(filename))
        img.save('%s-zbar.jpg' %filename)  
    return data 

def ocr_qrcode_zxing(filename):
    #在當前目錄生成臨時文件,規避java的路徑問題
    img= Image.open(filename)
    ran= int(random.random()*100000)
    img.save('%s%s.jpg' %(os.path.basename(filename).split('.')[0],ran))
    zx = zxing.BarCodeReader()
    data =''
    zxdata = zx.decode('%s%s.jpg' %(os.path.basename(filename).split('.')[0],ran))
    #刪除臨時文件
    os.remove('%s%s.jpg' %(os.path.basename(filename).split('.')[0],ran))
    if zxdata:
        logger.debug(u'zxing識別二維碼:%s,內容: %s' %(filename ,zxdata.data))
        data = zxdata.data
    else:
        logger.error(u'識別zxing二維碼出錯:%s' %(filename))
        img.save('%s-zxing.jpg' %filename)  
    return data

    
if __name__ == '__main__': 
    filename =r'D:\python\00025328.jpg'
 
    #zbar二維碼識別
    ltext = ocr_qrcode_zbar(filename)
    logger.info( u'[%s]Zbar二維碼識別:[%s]!!!' %(filename,ltext))
    print ltext
    
    #zbarlight二維碼識別
    ltext = ocr_qrcode_zbarlight(filename)
    logger.info( u'[%s]Zxing二維碼識別:[%s]!!!' %(filename,ltext))
    print ltext 

    #zxing二維碼識別
    ltext = ocr_qrcode_zxing(filename)
    logger.info( u'[%s]Zxing二維碼識別:[%s]!!!' %(filename,ltext))
    print ltext

 

二、使用對比

一、zbar和zbarlight內核一致,都是基於zbar的dll編譯加載的。java

二、zbarlight使用比zbar更簡單,不過是在zbar的基礎又作了一點點封裝而已。python

三、zxing是基於java的zxing核心的python分支,其原理是調用javaw 加載zxing的core.jar包,再獲取輸出結果。算法

zxing的調試是一個大坑,網上的資料都存在這樣那樣的信息過期問題,加上zxing對java的依賴問題更多,這篇博客 http://www.cnblogs.com/oucsheep/p/6269813.html 相對來講比較清晰,可是估計初學者看起來會比較累。api

 

 

三、總結:

一、項目的圖片來源因而紙質文件的掃描件(qrcode),實際狀況相對複雜,存在打印偏移,與其餘文字重疊、圖片變形、色帶缺墨致使圖片殘缺等多種可能性。雖然通過一系列的圖片處理,但目前來看三個包在容錯性都不算太好。微信

二、可是,可是…… 微信中的「掃一掃」,卻能夠作到正常識別,應該是微信的二維碼識別是有本身的獨到算法,遺憾微信沒有開放接口,也沒有查到相關資料。dom

三、支付寶的"掃一掃",識別率略次於微信,可是也比開源的幾個包要強的多。spa

四、網上有一些付費api,識別率也通常,懷疑也是基於zxing和zbar的二次封裝。debug

五、三流無名廠家的二維碼掃描頭硬件,直接掃描該紙質文件,識別率基本能夠作到90%以上,固然這不排除是掃描轉換時產生的信息丟失這個重要因素調試

綜上,以識別能力排序,硬件>微信>支付寶>zxing>zbarlight(zbar)。

軟件算法以微信最高,但比起硬件仍是有差距,期待高手破解或者剝離微信的算法,也歡迎商用api開發者進行交流(能夠付費),聯繫QQ 16906913 ,謝謝。

以上……

相關文章
相關標籤/搜索