初學Python.Opencv,想用它作個實例解決車牌號檢測。app
車牌號檢測須要分爲四個部分:1.車輛圖像獲取、2.車牌定位、3.車牌字符分割和4.車牌字符識別函數
在百度查到了車牌識別部分車牌定位和車牌字符分割,先介紹車牌定位部分學習
車牌定位須要用到的是圖片二值化爲黑白後進canny邊緣檢測後屢次進行開運算與閉運算用於消除小塊的區域,保留大塊的區域,後用cv2.rectangle選取矩形框,從而定位車牌位置ui
車牌字符的分割前須要準備的是隻保留車牌部分,將其餘部分均變爲黑色背景。這裏我採用cv2.grabCut方法,可將圖像分割成前景與背景。分割完成後,再通過二值化爲黑白圖後便可進行字符分割。因爲圖像中只有黑色和白色像素,所以咱們須要經過圖像的白色像素和黑色像素來分割開字符。即分別經過判斷每一行每一列的黑色白色像素值的位置,來定位出字符。具體程序附下spa
# -*- coding: utf-8 -*- """ Created on Tue Oct 23 20:46:45 2018 @author: Administrator """ import cv2 import numpy as np def stretch(img): ''' 圖像拉伸函數 ''' maxi=float(img.max()) mini=float(img.min()) for i in range(img.shape[0]): for j in range(img.shape[1]): img[i,j]=(255/(maxi-mini)*img[i,j]-(255*mini)/(maxi-mini)) return img def dobinaryzation(img): ''' 二值化處理函數 ''' maxi=float(img.max()) mini=float(img.min()) x=maxi-((maxi-mini)/2) #二值化,返回閾值ret 和 二值化操做後的圖像thresh ret,thresh=cv2.threshold(img,x,255,cv2.THRESH_BINARY) #返回二值化後的黑白圖像 return thresh def find_rectangle(contour): ''' 尋找矩形輪廓 ''' y,x=[],[] for p in contour: y.append(p[0][0]) x.append(p[0][1]) return [min(y),min(x),max(y),max(x)] def locate_license(img,afterimg): ''' 定位車牌號 ''' img,contours,hierarchy=cv2.findContours(img,cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE) #找出最大的三個區域 block=[] for c in contours: #找出輪廓的左上點和右下點,由此計算它的面積和長度比 r=find_rectangle(c) a=(r[2]-r[0])*(r[3]-r[1]) #面積 s=(r[2]-r[0])*(r[3]-r[1]) #長度比 block.append([r,a,s]) #選出面積最大的3個區域 block=sorted(block,key=lambda b: b[1])[-3:] #使用顏色識別判斷找出最像車牌的區域 maxweight,maxindex=0,-1 for i in range(len(block)): b=afterimg[block[i][0][1]:block[i][0][3],block[i][0][0]:block[i][0][2]] #BGR轉HSV hsv=cv2.cvtColor(b,cv2.COLOR_BGR2HSV) #藍色車牌的範圍 lower=np.array([100,50,50]) upper=np.array([140,255,255]) #根據閾值構建掩膜 mask=cv2.inRange(hsv,lower,upper) #統計權值 w1=0 for m in mask: w1+=m/255 w2=0 for n in w1: w2+=n #選出最大權值的區域 if w2>maxweight: maxindex=i maxweight=w2 return block[maxindex][0] def find_license(img): ''' 預處理函數 ''' m=400*img.shape[0]/img.shape[1] #壓縮圖像 img=cv2.resize(img,(400,int(m)),interpolation=cv2.INTER_CUBIC) #BGR轉換爲灰度圖像 gray_img=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY) #灰度拉伸 stretchedimg=stretch(gray_img) '''進行開運算,用來去除噪聲''' r=16 h=w=r*2+1 kernel=np.zeros((h,w),np.uint8) cv2.circle(kernel,(r,r),r,1,-1) #開運算 openingimg=cv2.morphologyEx(stretchedimg,cv2.MORPH_OPEN,kernel) #獲取差分圖,兩幅圖像作差 cv2.absdiff('圖像1','圖像2') strtimg=cv2.absdiff(stretchedimg,openingimg) #圖像二值化 binaryimg=dobinaryzation(strtimg) #canny邊緣檢測 canny=cv2.Canny(binaryimg,binaryimg.shape[0],binaryimg.shape[1]) '''消除小的區域,保留大塊的區域,從而定位車牌''' #進行閉運算 kernel=np.ones((5,19),np.uint8) closingimg=cv2.morphologyEx(canny,cv2.MORPH_CLOSE,kernel) #進行開運算 openingimg=cv2.morphologyEx(closingimg,cv2.MORPH_OPEN,kernel) #再次進行開運算 kernel=np.ones((11,5),np.uint8) openingimg=cv2.morphologyEx(openingimg,cv2.MORPH_OPEN,kernel) #消除小區域,定位車牌位置 rect=locate_license(openingimg,img) return rect,img def cut_license(afterimg,rect): ''' 圖像分割函數 ''' #轉換爲寬度和高度 rect[2]=rect[2]-rect[0] rect[3]=rect[3]-rect[1] rect_copy=tuple(rect.copy()) rect=[0,0,0,0] #建立掩膜 mask=np.zeros(afterimg.shape[:2],np.uint8) #建立背景模型 大小隻能爲13*5,行數只能爲1,單通道浮點型 bgdModel=np.zeros((1,65),np.float64) #建立前景模型 fgdModel=np.zeros((1,65),np.float64) #分割圖像 cv2.grabCut(afterimg,mask,rect_copy,bgdModel,fgdModel,5,cv2.GC_INIT_WITH_RECT) mask2=np.where((mask==2)|(mask==0),0,1).astype('uint8') img_show=afterimg*mask2[:,:,np.newaxis] return img_show def deal_license(licenseimg): ''' 車牌圖片二值化 ''' #車牌變爲灰度圖像 gray_img=cv2.cvtColor(licenseimg,cv2.COLOR_BGR2GRAY) #均值濾波 去除噪聲 kernel=np.ones((3,3),np.float32)/9 gray_img=cv2.filter2D(gray_img,-1,kernel) #二值化處理 ret,thresh=cv2.threshold(gray_img,120,255,cv2.THRESH_BINARY) return thresh def find_end(start,arg,black,white,width,black_max,white_max): end=start+1 for m in range(start+1,width-1): if (black[m] if arg else white[m])>(0.98*black_max if arg else 0.98*white_max): end=m break return end if __name__=='__main__': img=cv2.imread('../image/carnumber7.jpg',cv2.IMREAD_COLOR) #預處理圖像 rect,afterimg=find_license(img) #框出車牌號 cv2.rectangle(afterimg,(rect[0],rect[1]),(rect[2],rect[3]),(0,255,0),2) cv2.imshow('afterimg',afterimg) #分割車牌與背景 cutimg=cut_license(afterimg,rect) cv2.imshow('cutimg',cutimg) #二值化生成黑白圖 thresh=deal_license(cutimg) cv2.imshow('thresh',thresh) cv2.waitKey(0) #分割字符 ''' 判斷底色和字色 ''' #記錄黑白像素總和 white=[] black=[] height=thresh.shape[0] #263 width=thresh.shape[1] #400 #print('height',height) #print('width',width) white_max=0 black_max=0 #計算每一列的黑白像素總和 for i in range(width): line_white=0 line_black=0 for j in range(height): if thresh[j][i]==255: line_white+=1 if thresh[j][i]==0: line_black+=1 white_max=max(white_max,line_white) black_max=max(black_max,line_black) white.append(line_white) black.append(line_black) print('white',white) print('black',black) #arg爲true表示黑底白字,False爲白底黑字 arg=True if black_max<white_max: arg=False n=1 start=1 end=2 while n<width-2: n+=1 #判斷是白底黑字仍是黑底白字 0.05參數對應上面的0.95 可做調整 if(white[n] if arg else black[n])>(0.02*white_max if arg else 0.02*black_max): start=n end=find_end(start,arg,black,white,width,black_max,white_max) n=end if end-start>5: cj=thresh[1:height,start:end] cv2.imshow('cutlicense',cj) cv2.waitKey(0) cv2.waitKey(0) cv2.destroyAllWindows()
最後的結果圖供參考.net
這算是識別比較好的一張圖片,可是有些圖片仍然識別比較差,但願有大神能夠提出如下改進意見,可是鑑於本身目前處於初學者狀態,就先不深究,等到之後學習精進後再回頭解決目前解決不了的問題。下面附上網上大神的源代碼供你們參考。3d
https://blog.csdn.net/m0_38024433/article/details/78650024code
https://blog.csdn.net/sumkee911/article/details/79435983blog
2018.10.24圖片