圖像驗證碼識別(七)——字符分割

前面通過各類去除噪點、干擾線,驗證碼圖片如今已經只有兩個部分,若是pixel爲白就是背景,若是pixel爲黑就爲字符。正如前面流暢所提到的同樣,爲了字符的識別,這裏須要將圖片上的字符一個一個「扣」下來,獲得單個的字符,接下來再進行OCR識別。php

字符分割能夠說是圖像驗證碼識別最關鍵的一步,由於分割的正確與否直接關係到最後的結果,若是4個字符分割成了3個,即使後面的識別算法識別率達到100%,結果也是錯的。固然,前面預處理若是作得夠好,干擾因素可以有效的去除,而沒有影響到字符的pixel,那麼分割來說要容易得多。反過來,若是前面的干擾因素都沒有去除掉,那麼分割出來的可能就不是字符了。算法

字符的粘連是分割的難點,這一點也能夠做爲驗證碼安全係數的標準,若是驗證碼上的幾個字符徹底是分開的,那麼能夠保證字符分割成功率百分之百,這樣驗證碼破解的難度就下降了不少,好比下面的字符:安全

這個就是CSDN的驗證碼,通過二值化和降噪獲得的圖片,能夠看到這裏圖片已經很是乾淨,沒有一點多餘的信息,字符之間沒有重疊的部分,分割起來毫無難度。ide

固然,大多數IT巨頭的網頁驗證碼裏地字符都是粘連在一塊兒的,好比谷歌的驗證碼:spa

谷歌的驗證碼不只粘連成都很大,並且字符扭曲地也特別厲害,因此破解起來那是難度很是大了對象

至於圖片分割,我再這裏介紹兩種簡單地方法。圖片

1、 泛水填充法ci

泛水填充法在前面降噪的地方就提到過,主要思路仍是連通域的思想。對於相互之間沒有粘連的字符驗證碼,直接對圖片進行掃描,遇到一個黑的pixel就對其進行泛水填充,全部與其連通的字符都被標記出來,所以一個獨立的字符就可以找到了。這個方法優勢是效率高,時間複雜度是O(N),N爲像素的個數;並且不用考慮圖片的大小、相鄰字符間隔以及字符在圖片中得位置等其餘任何因素,任何驗證碼圖片只要字符相互是獨立的,不須要對其餘任何閥值作預處理,直接就操做;用這種方法分割正確率很是高,幾乎不會出現分割錯誤的狀況。可是缺點也很致命:那就是字符之間必須徹底隔離,沒有粘連的部分,不然會將兩個字符誤認爲一個字符。get

代碼以下:it

 

[cpp]  view plain  copy

  1. for (i = 0; i < nWidth; ++i)  
  2.         for (j = 0; j < nHeight; ++j)  
  3.         {  
  4.             if ( !getPixel(i,j) )  
  5.             {  
  6.                 //FloodFill each point in connect area using different color  
  7.                 floodFill(m_Mat,cvPoint(i,j),cvScalar(color));  
  8.                 color++;  
  9.             }  
  10.         }  
  11.   
  12.     int ColorCount[256] = { 0 };  
  13.     for (i = 0; i < nWidth; ++i)  
  14.     {  
  15.         for (j = 0; j < nHeight; ++j)  
  16.         {  
  17.             //caculate the area of each area  
  18.             if (getPixel(i,j) != 255)  
  19.             {  
  20.                 ColorCount[getPixel(i,j)]++;  
  21.             }  
  22.         }  
  23.     }  
  24.     //get rid of noise point  
  25.     for (i = 0; i < nWidth; ++i)  
  26.     {  
  27.         for (j = 0; j < nHeight; ++j)  
  28.         {  
  29.             if (ColorCount[getPixel(i,j)] <= nMin_area)  
  30.             {  
  31.                 setPixel(i,j,WHITE);  
  32.             }  
  33.         }  
  34.     }  
  35.   
  36.     int k = 1;  
  37.     int minX,minY,maxX,maxY;  
  38.     vector<Image> vImage;  
  39.     while( ColorCount[k] )  
  40.     {  
  41.         if (ColorCount[k] > nMin_area)  
  42.         {  
  43.             minX = minY = 100;  
  44.             maxX = maxY = -1;  
  45.             //get the rect of each charactor  
  46.             for (i = 0; i < nWidth; ++i)  
  47.             {  
  48.                 for (j = 0; j < nHeight; ++j)  
  49.                 {  
  50.                     if(getPixel(i,j) == k)  
  51.                     {  
  52.                         if(i < minX)  
  53.                             minX = i;  
  54.                         else if(i > maxX)  
  55.                             maxX = i;  
  56.                         if(j < minY)  
  57.                             minY = j;  
  58.                         else if(j > maxY)  
  59.                             maxY = j;  
  60.                     }  
  61.                 }  
  62.             }  
  63.             //copy to each standard mat  
  64.             Mat *ch = new Mat(HEIGHT,WIDTH,CV_8U,WHITE);  
  65.             int m,n;  
  66.             m = (WIDTH - (maxX-minX))/2;  
  67.             n = (HEIGHT - (maxY-minY))/2;  
  68.             for (i = minX; i <= maxX; ++i)  
  69.             {  
  70.                 for (j = minY; j <= maxY; ++j)  
  71.                 {  
  72.                     if(getPixel(i,j) == k)  
  73.                     {  
  74.                         *(ch->data+ch->step[0]*(n+j-minY)+m+(i-minX)) = BLACK;  
  75.                     }  
  76.                 }  
  77. <span style="white-space:pre">    </span>}  


這段代碼就是使用泛水填充法,每次掃到一個連通域就把連通域全部的pixel的灰度值改成0-255之間的一個值,好比第一個是254,下一個是253...接下來再對每個灰度值(即每個連通域)的pixel出現的X,Y座標的最大、最小的值記錄下來,這樣就獲得了每一個字符的最小外包矩形,最後將這個最小外包矩形所有複製到固定大小的一個單獨的Mat對象中,這個對象存儲的就是一個固定分辨率大小的表現爲單獨字符的圖片。

 

分割的效果能夠見下面的圖:

能夠看到,分割效果很是好。

2、X像素投影法

對於粘連的字符,也並不是沒有方法分割。一個方法就是將兩個粘連的驗證碼一刀切開,從哪裏切?固然是從粘連的薄弱的地方切。前面提到過圖片的像素就像一個二維的矩陣,對每個x值,統計全部x值爲這個值的pixel中黑色的數目,直觀來說就是統計每一條豎線上黑色點的數目。顯而易見的是,若是這一條線爲背景,那麼這一條線確定都是白色的,那麼黑色點的數目爲0,若是一條豎線通過字符,那麼這條豎線上的黑色點數目確定很多。

對於徹底獨立的兩個字符之間,確定有黑色點數目爲0的豎線,可是若是粘連,那麼不會有黑色點數爲0的豎線存在,可是字符粘連最薄弱的地方必定是黑色點數目最少的那條豎線,所以切就要從這個地方切。

在代碼的實現的過程當中,能夠先從左到右掃描一遍,統計投影到每一個X值的黑色點的數目,而後設定一個閥值範圍,這個閥值大概就是一個字符的寬度。從左到右,先找到第一個x黑色點投影不爲0的x值,而後在這個x值加上大概一個字符寬度的大小找到x投影數目最小的x值,這兩個x值分割出來就是一個字符了。

這個方法的特色就是可以分割粘連的字符,可是缺點就是容易分割不乾淨,可能會出現分割錯誤的狀況,另外就是須要提供相應的閥值。

代碼以下:

 

[cpp]  view plain  copy

  1. void Image::xProjectDivide(int nMin_thsd,int nMax_thsd)  
  2. {  
  3.     int i,j;  
  4.     int nWidth = getWidth();  
  5.     int nHeight = getHeight();  
  6.     int *xNum = new int[nWidth];  
  7.   
  8.     //inital the x-projection-num  
  9.     memset(xNum,0,nWidth*sizeof(int));  
  10.   
  11.     //compute the black pixel num in X coordinate  
  12.     for (j = 0; j < nHeight; ++j)  
  13.         for (i = 0; i < nWidth; ++i)  
  14.         {  
  15.             if ( getPixel(i,j) == BLACK ) xNum[i]++;  
  16.         }  
  17.     /*-----------------show x project map-------------------*/  
  18.     Mat xProjectResult(nHeight/2,nWidth,CV_8U,Scalar(WHITE));  
  19.   
  20.     for (i = 0; i < xProjectResult.cols-1; ++i)  
  21.     {  
  22.         int begin,end;  
  23.         if(xNum[i] > xNum[i+1])  
  24.         {  
  25.             begin = xNum[i+1];  
  26.             end = xNum[i];  
  27.         }  
  28.         else {  
  29.             begin = xNum[i];  
  30.             end = xNum[i+1];  
  31.         }  
  32.         for (j = begin; j <= end; ++j)  
  33.         {  
  34.             *(xProjectResult.data+xProjectResult.step[0]*(nHeight/2 - j - 1)+i) = BLACK;  
  35.         }  
  36.     }  
  37.   
  38.     std::cout << "The porject of BLACK pixel in X coordinate is in the window" << std::endl;  
  39.     namedWindow("xProjectResult");  
  40.     imshow("xProjectResult",xProjectResult);  
  41.     waitKey();  
  42.     /*-----------------show x project map-------------------*/  
  43.   
  44.     /*-------------------divide the map---------------------*/  
  45.     vector<int> vPoint;  
  46.     int nMin,nIndex;  
  47.     if (xNum[0] > BOUNDRY_NUM) vPoint.push_back(0);  
  48.     for(i = 1;i < nWidth-1 ;)  
  49.     {  
  50.         if( xNum[i] < BOUNDRY_NUM)  
  51.         {  
  52.             i++;  
  53.             continue;  
  54.         }  
  55.         vPoint.push_back(i);  
  56.         //find minimum between the min_thsd and max_thsd  
  57.         nIndex = i+nMin_thsd;  
  58.         nMin = xNum[nIndex];  
  59.         for(j = nIndex;j<i+nMax_thsd;j++)  
  60.         {  
  61.             if (xNum[j] < nMin)  
  62.             {  
  63.                 nMin = xNum[j];  
  64.                 nIndex = j;   
  65.             }  
  66.         }  
  67.         vPoint.push_back(nIndex);  
  68.         i = nIndex + 1;  
  69.     }  
  70.     if (xNum[nWidth-1] > BOUNDRY_NUM) vPoint.push_back(nWidth-1);  
  71.       
  72.     //save the divided characters in map vector  
  73.     int ch_width = nWidth / (vPoint.size()/2) + EXPAND_WIDTH;  
  74.     vector<Image> vImage;  
  75.     for (j = 0; j < (int)vPoint.size(); j += 2)  
  76.     {  
  77.         Mat *mCharacter = new Mat(nHeight,ch_width,CV_8U,Scalar(WHITE));  
  78.         for (i = 0; i < nHeight; ++i)  
  79.             memcpy(mCharacter->data+i*ch_width+EXPAND_WIDTH/2,m_Mat.data+i*nWidth+vPoint.at(j),vPoint.at(j+1)-vPoint.at(j));  
  80.         Image::ContoursRemoveNoise(*mCharacter,2.5);  
  81.         Mat *mResized = new Mat(SCALE,SCALE,CV_8U);  
  82.         resize(*mCharacter,*mResized,cv::Size(SCALE,SCALE),0,0,CV_INTER_AREA);  
  83.         Image iCh(*mResized);  
  84.         vImage.push_back(iCh);  
  85.         delete mCharacter;  
  86.     }  
  87.     //show divided characters  
  88.     char window_name[12];  
  89.     for (i = 0; i < (int)vImage.size(); ++i)  
  90.     {  
  91.         sprintf(window_name,"Character%d",i);  
  92.         //vImage.at(i).NaiveRemoveNoise(1.0f);  
  93.         vImage.at(i).ShowInWindow(window_name);  
  94.     }  
  95.   
  96.     delete []xNum;  
  97. }  


代碼首先統計每一個x座標對應的黑色點的數目,而後根據參數提供的閥值,找到字符之間的分割點,而後將分割點入棧,若是有4個字符,就入棧8個邊界。最後每次出棧兩個x值,將這兩個x值之間的全部像素都拷貝到一個新的Mat對象中去,這樣就獲得了一個獨立的字符圖片。

 

下面給出X像素投影法的運行結果圖:

相關文章
相關標籤/搜索