Python驗證碼識別處理實例

時間 2019-11-26

標籤 python 驗證碼識別處理實例欄目 Python 简体版

原文原文鏈接

1、準備工做與代碼實例html

一、PIL、pytesser、tesseractpython

(1)安裝PIL：下載地址：http://www.pythonware.com/products/pil/（CSDN下載）算法

下載後是一個exe，直接雙擊安裝，它會自動安裝到C:\Python27\Lib\site-packages中去，app

(2)pytesser:下載地址：http://code.google.com/p/pytesser/,（CSDN下載）機器學習

下載解壓後直接放C:\Python27\Lib\site-packages(根據你安裝的Python路徑而不一樣)，同時，新建一個pytesser.pth,內容就寫pytesser，注意這裏的內容必定要和pytesser這個文件夾同名，意思就是pytesser文件夾，pytesser.pth,及內容都要同樣！學習

(3)Tesseract OCR engine下載：http://code.google.com/p/tesseract-ocr/（CSDN下載）google

下載後解壓，tessdata文件夾，用其替換掉pytesser解壓後的tessdata文件夾便可。(就上面的pytesser文件夾)spa

2、驗證.net

（1）原理：code

驗證碼圖像處理

驗證碼圖像識別技術主要是操做圖片內的像素點,經過對圖片的像素點進行一系列的操做,最後輸出驗證碼圖像內的每一個字符的文本矩陣。

一、讀取圖片
二、圖片降噪
三、圖片切割
四、圖像文本輸出

（2）驗證字符識別

驗證碼內的字符識別主要以機器學習的分類算法來完成,目前我所利用的字符識別的算法爲KNN(K鄰近算法)和SVM (支持向量機算法),後面我會對這兩個算法的適用場景進行詳細描述。

一、獲取字符矩陣
二、矩陣進入分類算法
三、輸出結果

要驗證的圖片以下：

（3）、簡單的命令：

[python] view plain copy

from pytesser import *
image = Image.open('1.jpg') # Open image object using PIL
print image_to_string(image) # Run tesseract.exe on image

而後運行：

或者直接：

[html] view plain copy

print image_file_to_string('fnord.tif')

一樣能輸出結果！

（4）、複雜一點的

上面的只能對一些比較簡單的作處理，一

原理：彩色轉灰度，灰度轉二值，二值圖像識別

[python] view plain copy

運行後效果：

from: http://blog.csdn.net/evankaka/article/details/49533493

相關文章

相關標籤/搜索

圖像識別與處理

股票案例、驗證碼校驗

圖像處理實例

紅包項目實戰

代碼格式化

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。

最新文章

本站公眾號

歡迎關注本站公眾號,獲取更多信息

相關文章

>>更多相關文章<<